3. 결합 확률과 주변 확률

딥러닝에서 실질적으로 많이 쓰이는 개념 중 하나이니 꼼꼼히 읽어보기.

변수(variable): 독립변수 X. 다른 변수에 의하여 영향을 받지 않는 변수.

변량(variate): 종속변수 Y. 독립 변수에 영향을 받아 변화하는 변수.

다변수 확률 변수(Multivariate Random Variable): 확률 변수가 두 개 이상 있는 경우.

독립사건: 두 사건이 동시에 일어날 때 서로 영향을 주지 않는 사건.

종속사건: 한 사건의 결과가 다른 사건에 영향을 줄 때 두 사건을 종속사건이라고 함.

배반사건: 두 사건이 동시에 일어나지 않는 사건. 교집합이 없는 사건. 독립사건과 헷갈리지 말기.

결합확률: 두 개의 사건이 동시에 일어날 확률. 교집합이 발생할 확률.

표현: P(X, Y) or P(X ∩ Y)
결합확률함수(Joint Probability Function): X는 x1, x2,... 을 가질 수 있고, Y는 y1, y2,... 를 가질 수 있다고 가정할 때 결합확률함수의 표현식은 아래와 같다. 단순하게 f(x, y)라고 쓰기도 하며 X와 Y가 가진 범위에서 결합확률함수의 값을 모두 더하면 1이다.

예를 들어 X는 동전 1을 던졌을 때 결과, Y는 동전 2를 던졌을 때 결과라고 해보자.
- 결합확률함수의 합: f(앞, 앞) + f(앞, 뒤) + f(뒤, 앞) + f(뒤, 뒤) = 1/4 + 1/4 + 1/4 + 1/4 = 1

주변확률

주변질량함수: 다변수 확률 변수 중 하나의 확률 변수에 대해서만 확률 분포를 나타낸 함수.
예를 들어 X가 수학 등급, Y가 국어 등급을 나타내는 변수라고 했을 때, X를 기준으로 표현한 주변확률 질량 함수는 다음과 같다.
- Px(1) = Pxy(1, 1)+ Pxy(1, 2) + Pxy(1, 3) + Pxy(1, 4)
- Px(2) = Pxy(2, 1)+ Pxy(2, 2) + Pxy(2, 3) + Pxy(2, 4)
- Px(3) = Pxy(3, 1)+ Pxy(3, 2) + Pxy(3, 3) + Pxy(3, 4)
- Px(4) = Pxy(4, 1)+ Pxy(4, 2) + Pxy(4, 3) + Pxy(4, 4)