본문 바로가기

프로젝트 및 공모전9

[개인 프로젝트] 영화 관람객 수 예측 모델 📚 분석 개요 • 진행기간 : 2022.03.25 ~ 2022.04.02 • 참여인원 : 개인 • 사용 데이터 : 네이버 영화 정보 및 평점 데이터 • 분석 목적 : 이 분석에서는 국내에서 2005~2018년 기간에 개봉한 영화들의 데이터를 이용해서 관람객 수를 예측하는 모델을 만든다. 전체 분석 및 모델 구축 프로세스는 아래와 같다. 📌 목차 1. 데이터 및 라이브러리 불러오기 2. EDA(데이터 탐색) 2.1 기초통계량 확인 2.2 데이터 시각화 2.3 상관계수 확인 3. 추가 외부변수 수집 4. 데이터 전처리 4.1 결측치 처리 4.2 이상치 처리 4.3 더미변수화 4.4 Train/Test split 4.5 Feature Scaling 5. 모델 학습 6. 모델 성능 평가 📚 1.데이터 및 라이브.. 2022. 4. 4.
제10회 DB 금융경제 공모전 - 입선 ◈ 공모전 개요 • 참여 기간 : 2019.12. ~ 2020. 2 • 팀 구성 : 2명 • 개요 : 첫 공모전에서 제대로 된 분석을 해보지도 못하고 실패하고 나서 절치부심해서 다시 준비한 공모전이다. DB 금융경제 공모전은 크게 두 가지 분야 중 하나를 선택해서 참여할 수 있다. (1) 은행/보험 분야, (2) 증권/자산/금융경제 분야로 나뉘는데, 나는 (2)를 선택했다. 비교적 머신러닝을 접목할 수 있는 흥미로운 주제가 많을 것 같았고 사용가능한 데이터도 더 많을 것이라고 생각했기 때문이다. 함께 참가한 친구는 김씨고 나는 장씨여서, 팀명 김앤장으로 곧바로 참가 신청서를 제출했다. ◈ 진행 과정 ✅ 주제 선정 및 데이터 수집 전체 공모전 진행 과정에서 주제 선정과 데이터 수집에 가장 많은 시간을 투자.. 2022. 1. 31.
2019년 서울시 빅데이터 공모전 - 깔끔하게 실패한 첫 공모전 ◈ 공모전 개요 주제 : 별도의 주제 제한은 없으며 서울시 빅데이터 캠퍼스의 공공데이터를 사용해서 서울시의 사회문제를 해결한다 ◈ 진행 내용 학부 3학년 때 데이터 분석 공부를 시작하고 나서 처음 참여한 공모전이다. 당시 겨우 파이썬 조건문,반복문 할 줄 아는 상태였지만 일단 시작이 반이라는 생각에 공모전 참가 신청을 했다. 당시 함께 공부하던 친구와 매일 만나서 아이디어 회의를 했다. 당시에는 공공데이터가 무엇인지도 잘 몰랐지만, 우선은 창의적인 아이디어 도출을 위해서 이런저런 시도를 해보려고 했다. 최대한 기존 분석 사례와 겹치지 않으면서 유익하게 사용될 것이라고 '기대'한 주제를 알아보았고 '스마트 가로등 설치지역 제안'으로 결정했다. 스마트 가로등은 유동인구 및 날씨에 따른 효율적 에너지 사용, .. 2022. 1. 8.