차트 Charts | ||
{{{#!wiki style="margin:0 -10px -5px; min-height:calc(1.5em + 5px); word-break: keep-all" {{{#!folding [ 펼치기 · 접기 ] {{{#!wiki style="margin:-5px -1px -11px" | <colbgcolor=#4d4d4d><colcolor=#fff> 일반 그래프 | 그림그래프 · 막대그래프 · 선 그래프 |
비율 그래프 | 원 그래프 · 띠 그래프 | |
기타 | 카토그램 · 상자 수염 그림 · 줄기와 잎 그림 | }}}}}}}}} |
통계학 Statistics | |||
{{{#!wiki style="margin:0 -10px -5px; min-height:calc(1.5em + 5px); word-break: keep-all" {{{#!folding [ 펼치기 · 접기 ] {{{#!wiki style="margin:-5px -1px -11px" | <colbgcolor=#4d4d4d><colcolor=#fff> 수리통계학 | 기반 | 실해석학 (측도론) · 선형대수학 · 이산수학 |
확률론 | 사건 · 가능성 · 확률 변수 · 확률 분포 (표본 분포 · 정규 분포 · 이항 분포 · 푸아송 분포 · 카이제곱분포 · t분포 · Z분포 · F-분포 · 결합확률분포) · 확률밀도함수 · 확률질량함수 · 조건부확률 · 조건부기댓값 · 조건부분산 · 전체 확률의 법칙 · 베이즈 정리 · 도박사의 오류 · 도박꾼의 파산 · 몬티 홀 문제 · 뷔퐁의 바늘 · 마르코프 부등식 · 체비쇼프 부등식 · 큰 수의 법칙 (무한 원숭이 정리) · 중심극한정리 · 벤포드의 법칙 | ||
통계량 | 평균 (산술 평균 · 기하 평균 · 조화 평균 · 멱평균 · 대수 평균) · 기댓값 · 편차 (절대 편차 · 표준 편차) · 분산 (공분산) · 결정계수 · 변동계수 · 상관계수 · 대푯값 · 자유도 | ||
추론통계학 | 가설 · 변인 · 추정량 · 점추정 · 신뢰 구간 · 상관관계와 인과관계 · 실험통계학 · p-해킹 · 통계의 함정 · 그레인저 인과관계 · 신뢰도와 타당도 | ||
통계적 방법 | 회귀 분석 · 최소제곱법 · 분산 분석 · 주성분 분석 (요인 분석) · 시계열 분석 · 패널 분석 · 2SLS · 생존 분석 · GARCH · 비모수통계학 · 준모수통계학 · 기계학습 (군집 분석 · 분류 분석) · 위상 데이터분석 · 외삽법 · 메타 분석 · 모델링 (구조방정식) | ||
기술통계학 · 자료 시각화 | 도표 (그림그래프 · 막대그래프 · 선 그래프 · 원 그래프 · 상자 수염 그림 · 줄기와 잎 그림 · 산포도 · 산점도 · 히스토그램 · 도수분포표) · 그래프 왜곡 · 이상점 | }}}}}}}}} |
1. 수학, 통계에서
1.1. 개요
상자 수염 그림 (box and whisker plot, box and whisker diagram), 상자 그림 (box plot, boxplot), 상자-수염 그림, 상자 도표.다섯 숫자 요약을 그림으로 그린 그래프이다. 자료의 특성을 요약해서 보여 준다.
1.2. 설명
Q1에서 Q3 사이인 사분위간 범위(IQR)로 몸통을 구성하고 근접값들로 꼬리를 구성한다. 단위척도(step)는 1.5 x IQR이다.- 안 울타리 (inner fence)는 Q1에서 왼쪽으로 1 step만큼 간 것과 Q3에서 오른쪽으로 1 step만큼 간 것이다.
- 바깥 울타리 (outer fence)는 Q1에서 왼쪽으로 2 step만큼 간 것과 Q3에서 오른쪽으로 2 step만큼 간 것이다.
- 근접값 (adjacent value)은 안 울타리 안쪽의 값 중에서 안 울타리에 가장 가까운 값이다.
- 보통 이상점 (mild outlier)은 같은 방향에 있는 안 울타리와 바깥 울타리 사이에 있는 값이다.
- 극단 이상점 (extreme outlier)은 바깥 울타리 바깥의 값이다.
허리에 굵은 선이 그려진 박스가 있고 위 아래로 두 개의 세로선이 그어져 있으며, 종종 별표나 X표 같은 것도 둥실둥실 떠 있는 것이 특징. 전체 관찰값들의 범위 (range)에 기초한 시각화 방식인데, 그것이 포함하는 통계적 정보가 꽤 많아서 연구자들이 적극 활용하고 있다.
박스의 이쪽 끝에서 저쪽 끝은 주어진 분포의 사분위수 간 범위 (IQR; inter quartile range)를 의미한다. 그리고 2Q, 즉 두 번째 사분위수이자 전체 분포의 중앙값 (median)에는 굵은 가로선이 대응한다. 위쪽 수염의 끝부분은 최댓값 (max), 아래쪽 수염의 끝부분은 최솟값 (min)을 의미하며, 위아래로 나타나는 점 표시는 이상점 (아웃라이어)이다.
상자 도표는 정규분포와 함께 설명하는 것이 가장 정확한데, 전체 분포 범위의 가운데 50%가 상자의 범위와 정확히 일치한다. 박스의 양쪽 끝부분은 ±0.6745σ, 수염의 양쪽 끝부분은 ±2.6980σ 이다. 위쪽 수염과 아래쪽 수염은 각각 24.65%씩의 범위가 할당되어 있다.
상자 도표는 여러 모로 굉장한 장점들을 갖고 있다. 우선 이상점을 처리하는 데 뛰어나고, 데이터 전체의 편포 여부를 확인하는 것이 쉽다. 또한 데이터의 집단 간 비교, 데이터의 타당도(validity)를 체크하는 것도 용이하다.
1.3. 국내 교과 과정
2022 개정 교육과정부터 중학교 3학년 수학 교과에 최초로 들어올 예정이다. 다만, 이미 세계적으로는 중학교 시기에 다루는 나라가 많았으므로, 이는 대한민국이 뒤늦게 편승했을 뿐이다. 여담으로, 수학교육과 측에서는 새로 들어오는 내용에 대해 반대가 굉장히 심한 편인데, 이 '상자 그림' 내용 최초 도입엔 무려 60%가 넘는 동의표를 받았다. (에듀넷-티클리어 2022년 4월 중순에 열린 토론회 참조)2. 주식에서
주식 캔들 차트 |
주식 관련 파생 그래프로 위의 그래프와는 얼핏 비슷하게 생겼지만 대부분이 다르다.
자세한 내용은 캔들차트 문서 참고하십시오.