최근 수정 시각 : 2023-01-31 18:56:47

조건부분산


통계학
Statistics
{{{#!wiki style="margin:0 -10px -5px; min-height:calc(1.5em + 5px); word-break: keep-all"
{{{#!folding [ 펼치기 · 접기 ]
{{{#!wiki style="margin:-5px -1px -11px"
<colbgcolor=#4d4d4d><colcolor=#fff> 수리​통계학 기반 실해석학(측도론) · 선형대수학 · 이산수학
확률론 사건 · 가능성 · 확률변수 · 확률분포(표본분포 · 정규분포 · 이항분포 · 푸아송 분포 · 카이제곱분포 · t-분포 · z-분포 · F-분포) · 확률밀도함수 · 확률질량함수 · 조건부확률 · 조건부기댓값 · 조건부분산 · 전체 확률의 법칙 · 베이즈 정리 · 도박사의 오류 · 도박꾼의 파산 · 몬티 홀 문제 · 뷔퐁의 바늘 · 마르코프 부등식 · 체비쇼프 부등식 · 큰 수의 법칙(무한 원숭이 정리) · 중심극한정리 · 벤포드의 법칙
통계량 평균(산술평균 · 기하평균 · 조화평균 · 멱평균 · 대수평균) · 기댓값 · 편차(절대편차 · 표준편차) · 분산(공분산) · 결정계수 · 변동계수 · 상관계수 · 대푯값 · 자유도
추론​통계학 가설 · 변인 · 추정량 · 점추정 · 신뢰구간 · 상관관계와 인과관계 · 실험통계학 · p-해킹 · 통계의 함정 · 그레인저 인과관계 · 신뢰도와 타당도
통계적 방법 회귀 분석 · 최소제곱법 · 분산 분석 · 주성분 분석(요인 분석) · 시계열 분석 · 패널 분석 · 2SLS · 생존 분석 · GARCH · 비모수통계학 · 준모수통계학 · 기계학습(군집 분석 · 분류 분석) · 위상 데이터분석 · 외삽법 · 메타분석 · 모델링(구조방정식)
기술​통계학 · 자료 시각화 도표(그림그래프 · 막대그래프 · 선 그래프 · 원 그래프 · 상자 수염 그림 · 줄기와 잎 그림 · 산포도 · 산점도 · 히스토그램 · 도수분포표) · 그래프 왜곡 · 이상점 }}}}}}}}}

1. 개요2. 정의3. 성질

1. 개요

Conditional Variance

조건부 확률분포를 이용하여 조건부 분산을 정의할 수 있다.

2. 정의

이산 확률 변수

X와 Y가 이산 확률 변수인 경우 X가 주어진 경우 Y의 조건부 분산은 다음과 같이 정의된다.

[math(
\begin{aligned}
Var(Y | X = x) &= E[(Y-E[Y | X=x])^2 | X = x]\\
&= E[Y^2 | X = x] - E[Y | X = x]^2\\
&= \displaystyle\sum_y y^2P(Y=y|X=x) - (\displaystyle\sum_y yP(Y=y|X=x))^2
\end{aligned}
)]


연속 확률 변수

X와 Y가 연속 확률 변수이며, [math(f_{X,Y}(x,y))] 가 X 와 Y 의 결합 분포 이며, [math(f_X(x))] 가 X의 확률 밀도 함수 이면, X 가 주어진 경우 Y의 조건부 분산은 다음과 같이 정의된다.

[math(
\begin{aligned}
Var(Y | X = x) &= E[(Y-E[Y | X=x])^2 | X = x]\\
&= E[Y^2 | X = x] - E[Y | X = x]^2\\
&= \int y^2 \frac{f_{X,Y}(x,y)}{f_X(x)}dy - (\int y \frac{f_{X,Y}(x,y)}{f_X(x)}dy)^2\\
&= \int y^2 f_{Y|X}(y|x)dy - [\int y f_{Y|X}(y|x)dy]^2
\end{aligned}
)]


[math(E[Y | X = x])] 는 X가 주어진 경우 Y의 조건부기댓값 이다.

주의할점은, [math(Var[Y | X = x])] 는 [math(X = x)] 가 주어진 경우 Y의 조건부 분산이나 [math(Var[Y | X])] 는 X 가 어떤값을 무작위로 가질때 Y의 조건부 분산을 나타내는 확률 변수이다.

3. 성질

분산이 가지고 있는 모든 성질을 가지고 있다.

부가적으로, X 와 Y 가 확률변수일 경우 아래의 성질이 성립한다.

[math(Var[Y] = E[Var[Y | X]] + Var[E[Y | X]])] 전체 분산의 법칙 또는 반복 분산의 법칙 이라 불린다.

[ 증명 ]
[math(
\begin{aligned}
Var[Y] &= E[Y^2] - E[Y]^2\\
&= E[E[Y^2 | X]] - E[E[Y|X]]^2\\
&= E[Var[Y | X] + E[Y | X]^2] - E[E[Y|X]]^2\\
&= E[Var[Y | X]] + E[E[Y | X]^2] - E[E[Y | X]]^2\\
&= E[Var[Y | X]] + Var[E[Y|X]] \quad\quad \blacksquare
\end{aligned}
)]