본문 바로가기
데이터 분석/통계, 분석기법

Markov Chain Monte Carlo 개념

by 장찐 2021. 10. 10.

개념 

• 마코프 체인 : 

 과거 상태(S1, S2, .... S(t-1) ) 과 현재 상태( St ) 가 주어졌을 때, 미래 상태( S(t+1) ) 은, 

 과거 상태와 독립적으로 현재 상태에 의해서만 결정되는 "마코프 특성" 을 지닌 확률 과정을 의미함 

 

• 몬테 카를로 시뮬레이션 :

  랜덤 추출로 함수의 값을 확률적으로 계산하는 알고리즘. 계산하려는 값이 복잡한 경우에 근사값을 예상할 수 있음 

 

 

•MCMC 는 확률 변수의 사전분포에서 사후분포로 넘어가는 과정을 마코프 체인으로 계산하고, 

사후 분포를 계산할 때 몬테카를로 시뮬레이션으로 계산함. 그리고 이 사후분포로 추론을 하는것을 Bayesian Inference라고 부름

 

• 사전 분포에서 새로운 데이터가 추가되면, 이를 통해서 사후 분포를 만들고 추가된 데이터에 대한 값을 예측함. 즉 Prior Beliefs에서 새로운 데이터인 Evidence가 추가되면 전체 분포가 Posterior Beliefs로 변화한다. 이를 통해서 예측함 (ex. 신인 야구선수 타율 예시)

출처 : https://www.youtube.com/watch?v=z7rCogOaDh4  

• 현재의 확률 분포에, 새로운 관측치들을 계속 추가해서 업데이트 하다보면, 어느 순간 값이 변하지 않는 steady state에 도달한다. steady state와 관련이 적은 초기 값들은 burn을 통해서 제외하기도 한다. 

 

 

 


◈ Reference

• https://www.youtube.com/watch?v=z7rCogOaDh4 

  슬기로운 통계생활이라는 통계 커뮤니티에서 공유해주신 영상입니다. 굉장히 깔끔하게 설명을 잘해주셨습니다. 

 

 

 

댓글