본문 바로가기

전체 글184

.ipynb to .py 변환 방법 📚 .ipy → .py 파일로 변환하기 최근에 주로 Spyder IDE의 기능들이 괜찮아서 사용하고 있는데, 주피터 노트북에서 작성된 ipynb 파일을 사용할 때 문제가 발생했다. 구글링을 통해서 ipynb 파일을 py 파일로 변환할 수 있는 방법을 찾아서 정리했다. ✅ 설치 방법 윈도우 커맨드에서 주피터 노트북의 nbconvert를 설치한다. pip install nbconvert cd C:\Users\Yeong\Desktop\CDSS강의\입문_강의자료1\python_code 변환하고자 하는 파일이 있는 폴더로 이동한다. (윈도우 기준 탐색기 주소창의 주소를 그대로 복붙하면 됨) jupyter nbconvert --to script 파일명.ipynb nbconvert 의 명령어를 이용해서, 이동한 폴더.. 2022. 1. 12.
딥러닝 기본 개념 - 신경망 구조, 활성화 함수, Optimizer 📚 신경망 기본 구조 및 용어 설명 ✅ 입력층, 은닉층, 출력층 설명 ① 입력층(Input Layer) - feature에 대한 정보(독립변수)를 입력받고 다음 층으로 전달한다. - 입력층 노드의 수 = 독립변수의 수 ② 은닉층(Hidden Layer) - 종속변수를 예측하는데 중요한 특성이나 패턴을 추출한다. - 입력 받은 데이터를 활성화 함수(activation function)를 거쳐서 변환해서 전달함 - 은닉층 노드의 수 = 사용자가 설정 ③ 출력층(Output Layer) - 종속변수의 예측치를 출력한다. 회귀의 경우 종속변수의 값을 그대로 출력하고 분류는 각 종속변수 클래스의 확률을 출력함 회귀문제 : 출력 노드의 수 = 1 분류문제 : 출력 노드의 수 = 종속변수의 클래스 수 • 입력층과 출.. 2022. 1. 11.
컨텐츠 기반 추천(Content Based Filtering) 📚Content Based Filtering 개념 ✅ 기본 개념 IBCF는 특정 컨텐츠에 대해서 다른 유저들이 남긴 평점을 기반으로 유사도를 계산해서 추천을 진행하지만, 내용 기반 추천은 해당 컨텐츠의 내용 자체의 유사도로 추천하는 방식이다. 일반적인 단계는 다음과 같다. 1. 아이템 간의 유사도를 계산한다. 2. 추천 대상이 되는 사용자가 선호하는 아이템을 선정 3. 2번 단계에서 선정된 아이템과 가장 유사도가 높은 N개의 아이템을 찾는다. 4. 찾은 N개의 아이템을 사용자에게 추천한다. 위 과정에서 몇 가지 유의해야 할 부분들이 있다. 1.에서 아이템 간의 유사도를 사용하는 지표는 여러가지가 존재한다. 텍스트 데이터의 경우 TF-IDF와 같은 방법을 사용할 수 있다. 또한 2.에서 사용자가 좋게 평가.. 2022. 1. 10.
딥러닝 기본 개념 - 비용함수, 경사하강법, 규제 ◈ 딥러닝 기본 개념 설명 - 비용함수/경사하강법/규제 ✅ 비용함수(Cost Function), 손실함수(Loss Function) • 비용함수 : 학습데이터에 존재하는 전체의 에러 정도를 의미함. 즉 모델이 설명하지 못하는 정도를 나타냄 따라서, 파라미터의 최적 값은 비용함수의 값을 minimize 하는 값이라고 볼 수 있다. 대표적인 비용함수에는 MAE, MSE, RMSE가 있다. ✔ Normal Equation(정규방정식) : 비용함수가 아래로 볼록한2차 방정식 형태(convex form)인 경우, 미분해서 기울기가 0인 지점을 계산하면 비용함수를 최소화하는 지점을 찾을 수 있다. 하지만 이러한 형태로 비용함수가 나타나는 경우는 드물다. 실제 딥러닝의 비용함수는 우측과 같은 형태로 복잡하게 나타난다.. 2022. 1. 10.
2019년 서울시 빅데이터 공모전 - 깔끔하게 실패한 첫 공모전 ◈ 공모전 개요 주제 : 별도의 주제 제한은 없으며 서울시 빅데이터 캠퍼스의 공공데이터를 사용해서 서울시의 사회문제를 해결한다 ◈ 진행 내용 학부 3학년 때 데이터 분석 공부를 시작하고 나서 처음 참여한 공모전이다. 당시 겨우 파이썬 조건문,반복문 할 줄 아는 상태였지만 일단 시작이 반이라는 생각에 공모전 참가 신청을 했다. 당시 함께 공부하던 친구와 매일 만나서 아이디어 회의를 했다. 당시에는 공공데이터가 무엇인지도 잘 몰랐지만, 우선은 창의적인 아이디어 도출을 위해서 이런저런 시도를 해보려고 했다. 최대한 기존 분석 사례와 겹치지 않으면서 유익하게 사용될 것이라고 '기대'한 주제를 알아보았고 '스마트 가로등 설치지역 제안'으로 결정했다. 스마트 가로등은 유동인구 및 날씨에 따른 효율적 에너지 사용, .. 2022. 1. 8.
벌꿀오소리 블로그 소개 벌꿀오소리의 공부 일지 프로필 장영진(Jang Yeong Jin) 부산대학교 경영대학 경영학과 학사 졸업 (15.02 ~ 21.02) 연세대학교 경영대학 일반대학원 정보시스템(Information System) 전공 석사과정 (21.03 ~ 23.02 ) 금융권 신용정보 및 대안신용정보 분석 및 마케팅 업무 (23.01 ~ ) 이메일 : jiuoo3@naver.com 관심분야 : 추천 시스템, 머신러닝, 딥러닝, 빅데이터 분석 공모전 수상내역 (20.05.14) 제10회 DB 금융경제 공모전 입선 (온라인 뉴스 텍스트 마이닝을 통한 다우존스 지수 등락 예측) (2019.12.04) MICE 콘텐츠 공모전 대상 (2020 구독 경제 박람회) (20.06.12) 제1회 인공지능 응용 경진대회 장려상 : 클러.. 2022. 1. 4.