최대 1 분 소요

이 포스트에서는 기계학습으로 인과를 정복하기 위한 여정을 살펴본다.

‘correlation is not causation’ (상관관계는 인과관계가 아니다)

기존 고전적 통계는 상관관계(correlation)만을 이용해서 유의미한 정보를 얻으려고 했다. 원하는 질문에 답을 얻기 위해 방대한 데이터로부터 MLE 등 다양한 estimator를 사용해 정보를 추출하고, 상관관계를 분석했다.

선형회귀, scm 등 고전 기계학습도 마찬가지로 종속변수가 어떤 독립변수에 영향을 미치는지 상관관계만을 파악한다. 신경망을 사용하는 인공지능도 막대한 량의 데이터를 이용해 독립변수의 가중치를 조절해가며 학습한다.

그런데, 이 데이터들은 근본적으로 바보다. 데이터, 관찰은 두 변수에 대한 상관관계(A가 일어날때 B도 일어났어!)만 알려주지 인과관계를 알려줄 수 없다.

카테고리:

업데이트:

댓글남기기