본문 바로가기

데이터 분석42

Association Rules - 장바구니 분석 ◈ 개념 및 용어 정리 • Market basket analysis (Agrawal et al., 1993) 논문에서 처음 제시됨. • 비지도 학습의 일종으로, 고객들이 특정 품목을 구매할 때 어떤 다른 항목들을 같이 구매(co-occurence)하는지 분석하기 위해서 사용 •affinity analysis 또는 market basket analysis 라고도 불리며, cross-selling 목적으로 사용됨 •Apriori algorithm이 주로 사용되고, 계산량을 줄이기 위해서 support 개념을 이용해서 자주 등장하는 itemset 을 선정함 • 해당 규칙의 성과를 평가하기 위해서 confidence 와 lift 사용 ✔ 예시 : 고객들의 faceplate 구매 내역 ✔ 예시 : 특정 유저가 읽.. 2021. 11. 24.
Python - 리스트, 딕셔너리, 세트 파이썬의 기본적인 함수와 문법들을 정리하였습니다. 가장 기본적인 내용인데, 보통 판다스랑 넘파이로 데이터프레임만 다루다 보니 헷갈리는 경우들이 생겨서 더이상의 구글링을 막기 위해서 정리합니다. ✅ 리스트 관련 • 예시 리스트 ✔ append() : 값을 개별 요소로 추가 ✔ extend() : 값을 하나의 요소로 추가 ✔ remove() : 값 제거 ✔ index() : 인덱스 확인 ✔ inser() : 값 추가 ✔ 두 번 인덱싱 list1 = ['math','english'] list1[0] list1[0][1] 문자열로 구성된 리스트는 두 번 인덱싱이 가능하다. list1[0][1]은 첫 번째 요소인 math 의 1번 인덱스에 해당하는 a를 반환한다. list1 = [[0,1],[2,3]] list1.. 2021. 11. 20.
생존분석(Survival Analysis) : Kaplan-Meier / Cox Proportional Hazard / BYTD ◈ 개념 • 종속변수 : 특정 이벤트가 발생할 때, 발생하기까지 걸린 시간 • non-parametric / semi-parametric 으로 구분됨 → 모수적 방법이 훨씬 좋으나, 현실적으로 한계가 있기 때문에 비모수적 방법 사용함 • Death의 경우 죽었는지를 확인할 수 있지만, Survival의 경우 언제 죽는지 알 수 없다 (분석 기간 후에 사망할 수도) ✅ 사용 분야 : 원래 의학 분야에서 개발됐지만, 경영학에서도 고객 이탈 분석에서 사용됨 ① Acquisition Analytics : 사용자 획득 단계 분석 • 최소 비용으로 최대의 마케팅 효•율 내는 광고 채널 선택 ② Experience Analytics : 인앱에서 행동 분석 • 앱 설치 직후 행태 분석 → 지속 사용 유저 파악 • 로그.. 2021. 11. 15.
[Python] 주피터 노트북 셀 여백 조정 ◈ JupyterNotebook 셀 좌우 여백 조정 주피터 노트북을 사용하다 보면 좌우 여백의 간격이 너무 넓어서 사용이 불편할 때가 있다. 주피터 노트북 자체가 웹 기반 IDE라서 HTML을 이용해서 간단하게 여백 조정이 가능하다 • 코드 적용 전 화면 ​ • 입력 코드 from IPython.core.display import display, HTML display(HTML("")) display(HTML("")) #여백 줄이기 display(HTML("")) #In 부분 없애기 #display(HTML("")) #아예 다 없애기 #display(HTML("")) • 코드 적용 후 화면 2021. 11. 12.
데이터 사이언스 짤(memes) 모음 재미삼아 모으는 데이터 사이언스 밈...! 2021. 11. 3.
VAR (Vector Auto Regressive) 모형 보호되어 있는 글 입니다. 2021. 11. 1.