본문 바로가기
대외활동/LG Aimers

[LG Aimers] 인과추론 - 2. Causal Effect Identification

by rahites 2022. 7. 25.

LG Aimers 학습 내용 정리

출처 : https://www.lgaimers.ai/ 

 

 

인과 효과 (Causal Effect) 계산하는 방법 

Causal Effect Identifiability 

1. Query

2. Causal Diagram

3. Data

 

Z변수 : X와 Y에 서로 영향을 미치는 교란 변수

W변수 : X와 Y 중간에 있는 변수

이렇게 X, Y, Z, W 변수가 있는 world에서 Z가 X 변수에 미치는 영향이 사라지게 된다면 기존 $P(v) = P(z) * P(x|z) * P(w|x) * P(y|w,z)$ 에서 x에 대한 z의 조건부 확률이 1이되어 $P(v) = P(z) *  P(w|x) * P(y|w,z)$ 형태로 나타나게 된다. - 결합확률을 식으로 decompose한 뒤 x가 나오는 확률을 1로 바꾸면 중재 때의 확률분포가 어떻게 될 것인지를 볼 수 있다. 

 

ex. 계절의 예시( 결합확률과 주변확률의 정의를 이용해 식을 나타낼 수 있다 -> 인과 효과를 계산할 수 있음 )

 

- 하지만 위와 같이 전개된 식의 결합 분포에서 중재를 통해 존재하는 변수를 특정하여 해당 변수와 관련된 조건부 확률을 제거하는 방식으로 인과 효과를 계산하는 방법은 그래프의 모든 변수들이 관측 가능해야지만 모든 조건부 확률들을 이용할 수 있다. 

 

 

모든 변수들이 관측 가능하지 않다면??

 

Adjustment Formular : 인과 효과를 구하는 식

Back-door Criterion : 위를 더 일반화 한 것! ( 뒷문을 막는 변수 z를 찾아라 )

- x, y의 상관성에는 직접 연관성이 있는 상관성, 교란변수에 의해 나타나는 상관성 2가지가 존재한다.  여기서 인과 효과를 계산한다는 의미는 x가 변하면 y가 어떻게 변할가를 고민하는 것이다. 즉, 인과 효과를 계산하는 것은 주어져 있는 상관성 ( 데이터에 나타나는 상관성 ) 에서 교란에 의한 상관성을 제거하고자 하는 것이다. 

 

ex. Back-door Criterion 찾기

- Z는 X와 Y에 직접적인 영향 X : $Z_6$ 제외- X에서 Y로 갈 때에는 $Z_1$. $Z_4$, $Z_2$를 지나가는 Back-door가 있다. - Back-door Criterion은 Sound하다.  이를 통해 Fomular를 찾을 수 있지만 모든 fomular를 찾을 수 없는 것.

 

Rules of Do-calculus : 여러가지 다른 중재 조건에서 나오는 확률들끼리 서로 연결고리를 만들어주고 서로 다른 중재로 어떤 확률 분포를 바꿔주는 역할1. 관찰에 대한 것이 추가되거나 삭제될 수 있다. (조건부 독립)2. Action과 Observation을 바꿀 수 있다. 3. Action이 추가되거나 제거될 수 있다. 

 

- 어떠한 규칙에 의해 조건부 독립을 만족한다면 확률을 다른 확률로 변경시킬 수 있다. 

ex. Smoking -> Tar -> Cancer 

- 짧은 시간동안 알고리즘이 효과적으로 인과 효과가 계산될 수 있는지 없는지를 판단하고 계산될 경우 해당되는 식을 이끌어낸다. 

 

 

### 요약 ###

1. 어떻게 인과 효과가 주어져있는 관측 데이터를 통해 특정될 수 있는지 

2. Markov가정 아래 ( 모든 변수가 관측 가능 ) X가 집합이 아니라면 x가 들어있는 조건부확률을 전체 결합분포에서 지운다. 

3. Back-door Criterion : 단순하고 널리 쓰이지만 Complete하지 않다.

4. Back-door Criterion의 단점을 극복한 Do-calculus 존재

 

 

댓글