본문 바로가기
대외활동/LG Aimers

[LG Aimers] 인과추론 - 1. Causality

by rahites 2022. 7. 25.

LG Aimers 학습 내용 정리

출처 : https://www.lgaimers.ai/ 

 

 

인과추론

: 인과성의 의미, 인과 추론을 위한 기본적 개념

 

인과성이란? (Causality) : 하나의 어떤 무언가가 다른 무엇을 생성함에 있어 영향을 미치는 것

인과성과 인공지능, 기계학습, 데이터사이언스와의 연결고리 :

- 인공지능은 어떤 에이전트가 목표를 성취하기 위해 합리적인 액션을 취할지를 학습한다. 이 때 환경에 변화를 줘서 원하는 상태로 변화시키는 인과관계로의 해석이 가능하다. 

- 기계학습에서는 데이터의 상관성을 학습하며 이 결과를 커뮤니케이션 하는 과정에서 상관성과 인과성을 모두 복합적으로 고려한다.

 

인과 계층

1. 가장 기본적인 관측 계층 ( 변수들의 상관성 파악 )

2. 실험 계층 ( 주어져 있는 실험을 통해 나오는 결과에 관심 )

3. 반사실적 계층 ( 관측 값과 실험에 의한 값을 동시에 고려하는 반사실적 계층 )

ex. 아스피린을 먹고 두통이 없어짐 -> 아스피린을 먹지 않았다면 어떻게 됐을까? ( 반사실적 추론 )

 

초콜릿 소비와 노벨상 수상과의 scatter plot의 예시

- 상관성이 존재

- 나라가 부유하기 때문에 기초 과학에도 돈을 투자하고 초콜릿 같은 디저트도 많이 먹을 수 있다고 생각 가능!

 

Sympson's Paradox

신장결석 환자 - 환자를 진찰, 처방 - 처방에 따른 결과 리포트 - 헬스케어 리포트 

 

## 처방 방법 A, B 2가지가 존재할 때, 신장결석 사이즈가 작은 경우 처방 A가 효과가 더 좋고 신장결석 사이즈가 클 경우에도 처방 B의 효과가 더 좋은 경우가 있다. 이 때 처방 A가 무조건 더 좋은 처방인가?

: 그렇지 않다! 두 가지가 합쳐진 경우 B의 결과가 더 좋아보이게 나올 수 있다!! 

( 가상의 무작위 실험으로 인과관계를 계산할 수 있다 ) 

-> 인과적인 분석을 위해서는 데이터뿐만 아니라 각 변수들이 가지는 인과적 관계에 대한 자세한 이해가 필요하다! 

 

1. 주어진 데이터가 상관성을 지니고 있는지 or 인과성을 지니고 있는지 고려!

2. 우리가 알고자 하는 질문이 단순한 조건부 확률같은 상관성에 관한 것인지 or 인과성에 관한 것인지 고려!

 

 

계층을 넘나드는 추론을 하는 법

- Observation & Intervention ( Experiments )

- 인과추론은 우리가 알 수 없는 실험 결과를 관측 데이터와 연결하기 때문에 블랙박스에 대한 형식적인, 수학적인 이해가 필요하다. 

- Structural Causal Model을 기반으로 어떤 중재도 하지 않을 경우 관측 가능한 변수들에 대한 관측 분포를 볼 수 있다. ( U, V, F, P )

- causal diagram : 전문가들의 어떤 전문가적인 지식이나 상식 or 가정에 의해 만들어짐

 

* 중재 ( Intervention ) : do(·) 변수를 이용해 표현 , Causal Effects 

 

- 우리가 원하는 Causal Effect를 얻기 위해서는 Causal Diagram( 모델과 얼마나 관련이 있는지 )에 내포되어 있는 모든 정보를 이용해 인과 효과를 계산해야 한다.

- 그래프에서 어떤 두 변수간의 패스가 존재하는지 판단 -> 조건부 독립성을 이끌어낼 수 있다. 

 

댓글