본문 바로가기

데이터 분석42

Panel Data 분석 - Fixed Effect / Random Effect 📚 패널 데이터란? 위와 같이 Cross-sectional 데이터와 time-series 데이터의 특징을 둘 다 가지고 있는 데이터를 패널 데이터라고 한다. → A panel data set consists of a time series for each cross-sectional member 패널 데이터를 사용함으로써 얻을 수 있는 장점은 다음과 같다. 1. 개인이 가지고 있는 특이성(individual-specific heterogeneity)을 고려할 수 있음 2. 종단/횡단의 두 차원을 결합함으로써 more variation, less collinearity, more degrees of freedom 확보 3. cross sectional 또는 time-series 데이터 각각으로는 파악하기 힘.. 2022. 8. 26.
SQLD 시험 📚 SQLD 시험 정보 총점 60점 이상 합격. 과목당 40% 이하는 과락 (1과목 4문제 이상, 2과목은 16문제 이상 맞혀야 함) 1과목 : 모두 객관식 2과목 : 객관식 + 단답형 문제 10개 이내 ✅ Tips •1년에 4번, 접수 기간이 1주일 이라서 미리 접수 일정을 확인하고 있어야 함. 첫날에 접수하지 않으면 교통 편리한 곳은 첫날에 다 마무리 됨. 📌 3주 공부 전략 • 나만의 개념 정리 요약서 만들기 https://yurimac.tistory.com/40 • https://dataonair.or.kr/db-tech-reference/d-guide/sql/?pageid=5&mod=list 위 사이트에서 개념 보면서 정리 단, 게시글 29번부터는 (옵티마이저와 실행계획, 인덱스 기본, 조인 수.. 2022. 8. 16.
[코테] 그리디 알고리즘 📚그리디 알고리즘 주어진 문제를 단순하고 탐욕적으로 푸는 알고리즘. 탐욕적 이라는 것은 현재 상황에서 지금 당장 좋은 것만을 고르는 것을 의미한다. 대표적으로 가장 큰 화폐 단위부터 돈을 거슬러 주는 문제가 있다. ✔ 문제 손님이 돈 N원을 지불하였을 때, 500원/100원/50원/10원을 무한히 가지고 있는 매장직원이 거스름돈 동전을 몇개를 줘야하는가? n = 1260 count = 0 coin_types = [500, 100, 50, 10] for coin in coin_types: count += n// coin n %= coin print(count) 화폐의 종류가 K일때 위 코드의 시간 복잡도는 O(K)이다. 그리디 알고리즘을 사용하기 위해서는 그 해법이 정당한지를 검토해야 한다. 위 문제의 경.. 2022. 8. 13.
트위터 API v2 Academic Reserach 신청하기 📚 Twitter API 신청하기 연구를 위해서 트위터 데이터를 수집해야 하는 일이 있어서 트위터 API를 신청하게 됐다. 과거에도 신청했던 적이 있었는데 당시에 연구를 진행하다가 흐지부지되어서 제대로 키를 발급받지 못했었다. 트위터는 API key 발급이 까다로운 것으로 유명해서 조금 신경 써서 신청 과정을 진행했다. API 신청은 아래 Twitter Developer Platform에서 할 수 있다. https://developer.twitter.com/en Use Cases, Tutorials, & Documentation Publish & analyze Tweets, optimize ads, & create unique customer experiences with the Twitter API, .. 2022. 7. 23.
Fixed Effect vs Random Effect 📚Fixed Effect Model vs Random Effect Model ✅ Fixed Effect •개별 관측치의 특성을 나타내는 변수(ai)를 추가한다. 이 변수는 독립변수(xit)와 상관관계가 있음 • 각 관측치가 가지고 있는 개별적인 특징은 종속변수에 영향을 줄 수 있다. 따라서 이러한 특징들 중에서 time-invariant한 특징을 제거하기 위해서 FE 모델을 사용한다. • FE모델에서는 ai를 추정해야 하는 모수(parameter)로 간주되고, 상수항이 패널 개체마다 서로 다르면서 고정되어 있다고 가정한다. 이러한 ai는 위 그림과 같이 차분하거나 기간평균 차분 등을 이용하면 사라지게 된다. • 대부분의 경우 RE 모델보다 FE 모델이 더 많이 사용된다. 📌 Two-way fixed ef.. 2022. 7. 3.
연구방법론 기본 개념 📚 연구방법론 기본 개념 ✅ Empirical Research process (1) Research Question 연구자가 특정 상황에 대한 의문점을 질문으로 기술한다. • 특정 현상에 대해서 구체적인 문제를 제시해야 함 (모호해서는 X) • 기존의 연구 사례들을 다양하게 고려해서 연구질문을 도출해야 함 • 2개 이상의 변수들 간의 관계를 다루어야 한다. • 실증적 연구를 통해서 해결 가능해야 한다. (2) Hypothesis : 연구 질문에 대한 가설을 설정한다. 가설은 2개 이상의 변수에 대한 잠정적인 설명을 의미한다. • 연구 문제의 구체화 • 실증적으로 검증 가능해야 함 • 잠정적인 방향과 대답을 제시할 수 있어야 함 (3) Study Design : 가설을 검증하기 위한 구체적인 전략을 수립한.. 2022. 6. 30.