차트 Charts | ||
{{{#!wiki style="margin:0 -10px -5px; min-height:calc(1.5em + 5px); word-break: keep-all" {{{#!folding [ 펼치기 · 접기 ] {{{#!wiki style="margin:-5px -1px -11px" | <colbgcolor=#4d4d4d><colcolor=#fff> 일반 그래프 | 그림그래프 · 막대그래프 · 선 그래프 |
비율 그래프 | 원 그래프 · 띠 그래프 | |
기타 | 카토그램 · 상자 수염 그림 · 줄기와 잎 그림 | }}}}}}}}} |
통계학 Statistics | |||
{{{#!wiki style="margin:0 -10px -5px; min-height:calc(1.5em + 5px); word-break: keep-all" {{{#!folding [ 펼치기 · 접기 ] {{{#!wiki style="margin:-5px -1px -11px" | <colbgcolor=#4d4d4d><colcolor=#fff> 수리통계학 | 기반 | 실해석학 (측도론) · 선형대수학 · 이산수학 |
확률론 | 사건 · 가능성 · 확률 변수 · 확률 분포 (표본 분포 · 정규 분포 · 이항 분포 · 푸아송 분포 · 카이제곱분포 · t분포 · Z분포 · F-분포 · 결합확률분포) · 확률밀도함수 · 확률질량함수 · 조건부확률 · 조건부기댓값 · 조건부분산 · 전체 확률의 법칙 · 베이즈 정리 · 도박사의 오류 · 도박꾼의 파산 · 몬티 홀 문제 · 뷔퐁의 바늘 · 마르코프 부등식 · 체비쇼프 부등식 · 큰 수의 법칙 (무한 원숭이 정리) · 중심극한정리 · 벤포드의 법칙 | ||
통계량 | 평균 (제곱평균제곱근 · 산술 평균 · 기하 평균 · 조화 평균 · 멱평균 · 대수 평균) · 기댓값 · 편차 (절대 편차 · 표준 편차) · 분산 (공분산) · 결정계수 · 변동계수 · 상관계수 · 대푯값 · 자유도 | ||
추론통계학 | 가설 · 변인 · 추정량 · 점추정 · 신뢰 구간 · 상관관계와 인과관계 · 실험통계학 · p-해킹 · 통계의 함정 · 그레인저 인과관계 · 신뢰도와 타당도 | ||
통계적 방법 | 회귀 분석 · 최소제곱법 · 분산 분석 · 주성분 분석 (요인 분석) · 시계열 분석 · 패널 분석 · 2SLS · 생존 분석 · GARCH · 비모수통계학 · 준모수통계학 · 기계학습 (군집 분석 · 분류 분석) · 위상 데이터분석 · 외삽법 · 메타 분석 · 모델링 (구조방정식) | ||
기술통계학 · 자료 시각화 | 도표 (그림그래프 · 막대그래프 · 선 그래프 · 원 그래프 · 상자 수염 그림 · 줄기와 잎 그림 · 산포도 · 산점도 · 히스토그램 · 도수분포표) · 그래프 왜곡 · 이상점 | }}}}}}}}} |
1. 개요
stem-and-leaf plot(미)/stem-and-leaf diagram(영)줄기와 잎 그림이란, 그래프의 일종으로 자료의 값을 높은 자리의 수와 낮은 자리의 수로 분할한 뒤 전자를 '줄기', 후자를 '잎'으로 칭하여 표로 나타낸 것이다.
2. 그리는 법
아래와 같이 학생들의 멀리뛰기 기록을 조사해서 다음의 값을 얻었다고 생각해보자.먼저, 자료의 값을 큰 자리의 수와 작은 자리의 수로 분할해야 한다. 자료의 값이 모두 두 자리 수이므로 어차피 분할하는 방법이 하나밖에 없다. 십의 자리를 '줄기', 일의 자리를 '잎'으로 하여 줄기와 잎 그림을 다음과 같이 그릴 수 있다.
위 결과를 보며 줄기와 잎 그림을 그릴 때의 주의점을 검토해 보자.
- 중복되는 값이라고 해서 한 번만 쓰면 안 되고, 중복되는 만큼 써야 한다.
- '[math(16|0)]은 [math(160\,\rm cm)]'[1]와 같이 줄기와 잎의 단위가 어떻게 나타내는지 별도로 밝혀주어야 하며, 이때 값을 나타내는 단위 역시 주의해야 한다.
이번에는 위와 같이 [math(\rm (a))]를 줄기와 잎 그림을 각각 [math(\rm (b))]와 [math(\rm (c))]로 나타내 보자. 이때, [math(\rm (c))]는 줄기가 하나밖에 없어 한눈에 알아보기 어려우므로, 줄기와 잎의 단위를 잘못 선정한 것이다. 따라서 적절한 것은 백의 자리와 십의 자리를 줄기로 하고 일의 자리를 잎으로 한 것으로 [math(\rm (b))]이며, 이는 명백히 전자에 비해 학생들의 키 분포가 어떠한지 한 눈에 알아보기 쉽다. 한편, 이 결과는 꼭 맨 앞 자리만이 줄기가 될 수 있는 것은 아니므로 상황에 맞게 줄기와 잎을 정해야 한다는 것을 시사하고 있다.
3. 예제
줄기와 잎 그림은 중학교 과정의 내용이고, 다음처럼 고등학교 입학 직후의 첫 모의평가인 3월 교육청 모의평가에서 3점짜리로 출제되곤 한다. 통계 분야의 내용이므로 중앙값, 최빈값, 평균 등의 다른 개념과 복합하여 출제되기도 한다.2021년 3월 고1 7번 |
자료에 나타난 값은 모두 20개이므로, 중앙값은 10번째 값 21과 11번째 값 25의 평균인 23이다. 단위는 '시간'이므로, 정확한 답은 '23시간'이다.
4. 기타
- 한편, 실제로 '줄기와 잎 그림'에 걸맞은 꼴로도 그릴 수 있는데 바로 수형도이다. 실제로 위의 멀리 뛰기 기록 예제를 수형도로 나타내면 아래와 같이 된다.
- 대한민국 수학 교육과정상 중1 때 배운다.
- 대중교통의 운행시간표를 이런 형식으로 만드는 경우가 많이 있다. 주로 줄기는 시, 잎은 분에 대응하도록 만든다.[심화과정]
[1] 잎은 일의 자리만 써야 하고, 줄기는 십의 자리 이상[심화과정] 스지야는 당연히 저런 간단한 걸 보지 않는다. 리다이렉트 문서 위에 무슨 빽빽한 선이 있는 게 있는데 그게 도카이도 신칸센의 하루치 운행표다. 그걸 줄기와 잎 그림으로 만드는 것. 당연히 쉬운 일이 아니다.