통계학 Statistics | |||
{{{#!wiki style="margin:0 -10px -5px; min-height:calc(1.5em + 5px); word-break: keep-all" {{{#!folding [ 펼치기 · 접기 ] {{{#!wiki style="margin:-5px -1px -11px" | <colbgcolor=#4d4d4d><colcolor=#fff> 수리통계학 | 기반 | 실해석학 (측도론) · 선형대수학 · 이산수학 |
확률론 | 사건 · 가능성 · 확률 변수 · 확률 분포 (표본 분포 · 정규 분포 · 이항 분포 · 푸아송 분포 · 카이제곱분포 · t분포 · Z분포 · F-분포 · 결합확률분포) · 확률밀도함수 · 확률질량함수 · 조건부확률 · 조건부기댓값 · 조건부분산 · 전체 확률의 법칙 · 베이즈 정리 · 도박사의 오류 · 도박꾼의 파산 · 몬티 홀 문제 · 뷔퐁의 바늘 · 마르코프 부등식 · 체비쇼프 부등식 · 큰 수의 법칙 (무한 원숭이 정리) · 중심극한정리 · 벤포드의 법칙 | ||
통계량 | 평균 (제곱평균제곱근 · 산술 평균 · 기하 평균 · 조화 평균 · 멱평균 · 대수 평균) · 기댓값 · 편차 (절대 편차 · 표준 편차) · 분산 (공분산) · 결정계수 · 변동계수 · 상관계수 · 대푯값 · 자유도 | ||
추론통계학 | 가설 · 변인 · 추정량 · 점추정 · 신뢰 구간 · 상관관계와 인과관계 · 실험통계학 · p-해킹 · 통계의 함정 · 그레인저 인과관계 · 신뢰도와 타당도 | ||
통계적 방법 | 회귀 분석 · 최소제곱법 · 분산 분석 · 주성분 분석 (요인 분석) · 시계열 분석 · 패널 분석 · 2SLS · 생존 분석 · GARCH · 비모수통계학 · 준모수통계학 · 기계학습 (군집 분석 · 분류 분석) · 위상 데이터분석 · 외삽법 · 메타 분석 · 모델링 (구조방정식) | ||
기술통계학 · 자료 시각화 | 도표 (그림그래프 · 막대그래프 · 선 그래프 · 원 그래프 · 상자 수염 그림 · 줄기와 잎 그림 · 산포도 · 산점도 · 히스토그램 · 도수분포표) · 그래프 왜곡 · 이상점 | }}}}}}}}} |
1. 개요
Conditional Variance조건부 확률분포를 이용하여 조건부 분산을 정의할 수 있다.
2. 정의
이산 확률 변수X와 Y가 이산 확률 변수인 경우 X가 주어진 경우 Y의 조건부 분산은 다음과 같이 정의된다.
[math(
\begin{aligned}
Var(Y | X = x) &= E[(Y-E[Y | X=x])^2 | X = x]\\
&= E[Y^2 | X = x] - E[Y | X = x]^2\\
&= \displaystyle\sum_y y^2P(Y=y|X=x) - (\displaystyle\sum_y yP(Y=y|X=x))^2
\end{aligned}
)]
\begin{aligned}
Var(Y | X = x) &= E[(Y-E[Y | X=x])^2 | X = x]\\
&= E[Y^2 | X = x] - E[Y | X = x]^2\\
&= \displaystyle\sum_y y^2P(Y=y|X=x) - (\displaystyle\sum_y yP(Y=y|X=x))^2
\end{aligned}
)]
연속 확률 변수
X와 Y가 연속 확률 변수이며, [math(f_{X,Y}(x,y))] 가 X 와 Y 의 결합 분포 이며, [math(f_X(x))] 가 X의 확률 밀도 함수 이면, X 가 주어진 경우 Y의 조건부 분산은 다음과 같이 정의된다.
[math(
\begin{aligned}
Var(Y | X = x) &= E[(Y-E[Y | X=x])^2 | X = x]\\
&= E[Y^2 | X = x] - E[Y | X = x]^2\\
&= \int y^2 \frac{f_{X,Y}(x,y)}{f_X(x)}dy - (\int y \frac{f_{X,Y}(x,y)}{f_X(x)}dy)^2\\
&= \int y^2 f_{Y|X}(y|x)dy - [\int y f_{Y|X}(y|x)dy]^2
\end{aligned}
)]
\begin{aligned}
Var(Y | X = x) &= E[(Y-E[Y | X=x])^2 | X = x]\\
&= E[Y^2 | X = x] - E[Y | X = x]^2\\
&= \int y^2 \frac{f_{X,Y}(x,y)}{f_X(x)}dy - (\int y \frac{f_{X,Y}(x,y)}{f_X(x)}dy)^2\\
&= \int y^2 f_{Y|X}(y|x)dy - [\int y f_{Y|X}(y|x)dy]^2
\end{aligned}
)]
[math(E[Y | X = x])] 는 X가 주어진 경우 Y의 조건부기댓값 이다.
주의할점은, [math(Var[Y | X = x])] 는 [math(X = x)] 가 주어진 경우 Y의 조건부 분산이나 [math(Var[Y | X])] 는 X 가 어떤값을 무작위로 가질때 Y의 조건부 분산을 나타내는 확률 변수이다.
3. 성질
분산이 가지고 있는 모든 성질을 가지고 있다.부가적으로, X 와 Y 가 확률변수일 경우 아래의 성질이 성립한다.
[math(Var[Y] = E[Var[Y | X]] + Var[E[Y | X]])] 전체 분산의 법칙 또는 반복 분산의 법칙 이라 불린다.
- [ 증명 ]
- [math(
\begin{aligned}
Var[Y] &= E[Y^2] - E[Y]^2\\
&= E[E[Y^2 | X]] - E[E[Y|X]]^2\\
&= E[Var[Y | X] + E[Y | X]^2] - E[E[Y|X]]^2\\
&= E[Var[Y | X]] + E[E[Y | X]^2] - E[E[Y | X]]^2\\
&= E[Var[Y | X]] + Var[E[Y|X]] \quad\quad \blacksquare
\end{aligned}
)]