본문 바로가기

데이터 분석42

경영학에서 머신러닝이란 : 예측력 vs 설명력 ◈ 경영학-정보시스템 분야에서 데이터 사이언스 • IS 전공자이자, 데이터 분석가를 목표로 하는 입장에서, 요즘에는 가장 근본적인 질문에 대한 고민을 끊임없이 하고 있다. 데이터사이언스는 분야의 특성 상 여러 영역에 걸쳐있다보니, 사람마다 의견이 다른 경우도 많고 아직 합의된 의견이 도출되지 않은 부분도 있다. • 이는 데이터 사이언스 전문가가 되기위해서는 그만큼 다방면의 지식이 필요하고, 이 지식을 활용하는 과정에서도 많은 고민이 필요하다는 의미이다. 단순히 기계적인 분석으로는 뛰어난 데이터 분석가가 될 수 없다는 것을 절실하게 느끼고 있다. 학부 때만 해도 IDE에 결과만 잘 출력되면 '내가 데이터 분석을 잘 배워가고 있구나' 생각했었는데, 정말 우물안 개구리 그 자체였다... • 경영학의 Infor.. 2021. 10. 31.
윈도우에서 아나콘다 가상환경 설정 📚 Anaconda 가상환경 설정 ✅ 가상환경 생성 • 아나콘다 PowerShell 실행 (윈도우 커맨드도 같음) • Python, Spyder 버전 설정 후 생성 $conda create -n 이름 python=3.8 spyder=4 ✅ 가상환경 실행 • 현재 가상환경 목록 확인 $ conda env list • 가상환경 실행 $ conda activate 이름 • 스파이더 실행 $ spyder ✅ 비활성화 • 주피터/스파이더 종료 : Ctrl + C 두번 누르기 • 현재 가상환경 비활성화 : $deactivate • 다른 가상환경 비활성화 : $deactivate 가상환경 이름 ✅ Tensorflow 설치 • Tensorflow 설치 $ conda update -n base conda $ conda .. 2021. 10. 25.
Colab ↔ 구글 드라이브 연결 방법 from google.colab import drive ROOT = "/content/drive" print(ROOT) drive.mount(ROOT) #드라이브 경로로 이동 %cd drive/'My Drive'/'Colab Notebooks'/'소상공인' #파일 목록 %ls 2021. 10. 25.
unicodeescape 에러 해결 import pandas as pd df = pd.read_csv(r'C:\user\desktop\data.csv') 이 방식으로 데이터를 주로 불러 왔었는데(폴더 경로 수정이 번거로워서), IDE에서 로딩하고 실행하는 데에는 문제가 없지만 디버깅을 할 때 위와 같은 유니코드 에러 메세지가 발생했다. import pandas as pd df = pd.read_csv('C:/user/desktop/data.csv') 구글링 해보니, \ 문자가 유니코드로 인식되는 문제라고 한다. 따라서 \ 대신 / 를 사용하거나 \\를 사용하면 정상적으로 로딩 및 디버깅이 가능하다. 2021. 10. 11.
Markov Chain Monte Carlo 개념 ◈ 개념 • 마코프 체인 : 과거 상태(S1, S2, .... S(t-1) ) 과 현재 상태( St ) 가 주어졌을 때, 미래 상태( S(t+1) ) 은, 과거 상태와 독립적으로 현재 상태에 의해서만 결정되는 "마코프 특성" 을 지닌 확률 과정을 의미함 • 몬테 카를로 시뮬레이션 : 랜덤 추출로 함수의 값을 확률적으로 계산하는 알고리즘. 계산하려는 값이 복잡한 경우에 근사값을 예상할 수 있음 •MCMC 는 확률 변수의 사전분포에서 사후분포로 넘어가는 과정을 마코프 체인으로 계산하고, 사후 분포를 계산할 때 몬테카를로 시뮬레이션으로 계산함. 그리고 이 사후분포로 추론을 하는것을 Bayesian Inference라고 부름 • 사전 분포에서 새로운 데이터가 추가되면, 이를 통해서 사후 분포를 만들고 추가된 데.. 2021. 10. 10.
딕셔너리, 세트 정리 딕셔너리, 세트의 개념과 기본 특징을 정리하였습니다. 그동안 여러 차례 분석과 프로젝트를 진행 했었지만, 디셔너리 형태로 정리된 데이터를 다뤄본 적이 많이 없었습니다. 매번 다룰 때마다 헷갈렸던 부분이라, 조금씩 정리해서 포스트를 업데이트 하고자 합니다. 참고 자료 : 파이썬 스킬업(브라이언 오버랜드 저) 1. 딕셔너리 키-값 쌍으로 구성된 열거형 데이터 컬렉션 #딕셔너리 생성 grade = {'A':10, 'B':35, 'C':50} #값 추가 grade['E'] = 75 #키를 사용해서 특정 값 출력 grade['A'] 데이터 프레임 인덱싱과 동일한 방식으로 쌍을 추가하거나 출력할 수 있다. #빈 딕서녀리 생성 grade = {} grade['Q'] = 10 리스트와 동일하게 빈 딕셔너리를 생성하고 .. 2021. 9. 25.