1. 정의
표준점수(標準點數)는 원점수가 정규 분포를 따른다고 가정하고 일정한 공식을 통해 변환한 점수를 뜻하는 말로, 준말로 표점이라 하기도 한다.원점수는 시험의 난이도를 반영하지 못하고, 원점수만으로는 수험자의 상대적 위치를 알 수 없기 때문에 대학수학능력시험이나 지능 지수(IQ) 검사 등에서는 표준점수를 사용한다.
표준점수의 기본 중의 기본은 Z점수로, 이 Z점수를 2차 가공하면 다른 표준점수들을 얻을 수 있다. Z점수는 '(자신의 원점수 - 자신이 속한 집단의 원점수 평균)/원점수 표준편차'로 구한다.[1] 이론상 Z점수는 최대치와 최저치가 존재하지 않으나 일반적으로는 -5부터 5까지의 값[2]을 가진다. Z점수의 분포는 원 집단과 동일하며, 평균은 0, 표준편차는 1이다. 센스가 있다면 금방 알아차렸겠지만 평균이 0이기 때문에 평균 이하의 값은 음수로 표현되며 소수점이 매우 길어져 지저분해진다.
이런 단점을 극복하기 위한 것중 유명한 것이 T점수다. T점수는 평균을 50, 표준편차를 10으로 설정한 것인데 수능의 표준점수가 이 T점수를 이용한다. 원래 10z+50으로 구하는데, 정확히는 원점수 50점 만점인 과목은 T점수 공식을 그대로 10z+50으로 사용하고, 원점수 100점 만점인 과목은 T점수를 2배 하여 20z+100으로 사용한다.
IQ검사는 검사기관마다 다소 다르기는 하지만 보통 상대검사 방식이며, 이때의 공식은 15z+100이다. 평균 100, 표준편차 15기 때문에 1표준편차인 IQ 85~115에 대부분(68%)의 사람들이 들어간다. 절대검사도 있지만 대부분의 검사는 다시 말하지만 상대검사다. 즉 동일 집단에서 동일한 시간과 공간에서 검사를 받지 않았다면 단순히 IQ만으로 높다 낮다를 판단할 수 없다. 현재 가장 널리 쓰이는 웩슬러 지능검사에서는 정의만 표준점수이고 실제 IQ 점수는 절대평가로 채점한 뒤 원점수 - 표준점수 대응표에 대입해서 구하는 방식으로 한다.
C점수는 2z+5로 구하며 평균은 5, 표준편차를 2로 하는 표준점수 척도로, 1~9까지의 범위를 가지나 간혹 그 범위를 초과할 수도 있다. 10에서 C점수를 빼면 스테나인 점수를 얻을 수 있다.
스테나인 점수는 역시 1~9사이의 정수값만을 가진다. 눈치챘겠지만 스테나인 점수가 바로 수능이나 내신에서 사용되는 등급제다.
덧붙여서 일본의 고등학교에서는 편차치라는 개념을 많이 사용한다. 그 학교가 전국에서 성적을 기준으로 어느 정도에 위치해있나를 확인할 수 있는 지표다. 편차치의 평균은 50으로 50 이상의 값은 평균 이상의 학교라는 뜻이고, 50 이하의 값은 평균 이하의 학교라는 뜻이다. 공식은 T점수 척도를 이용한다.
표준점수는 'Z값 = (자신의 원점수 - 자신이 속한 집단의 평균) / 표준편차' 에 따라 결정되는데, 여기서 (자신의 원점수 - 자신이 속한 집단의 원점수 평균)은 바로 '자신의 편차'에 해당한다[3]. 따라서 Z값은 자신의 편차값이 양수인가 혹은 음수인가[4], 그리고 자신의 편차가 표준편차(대략 자신이 속한 집단에 존재하는 편차들의 평균이라고 생각하면 된다)에 비해 몇 배인가에 의해 구체적인 Z값이 결정된다. 이는 다른 사람에 비해 잘했는가 못했는가, 또 그들보다 얼마나 잘했는가 못했는가에 따라 평가가 이루어지는 전형적인 상대평가 시스템이다.
2. 수능에서의 표준점수
현행 입시 제도 중 수능에서 가장 많이 반영되는 입시 지표로 원점수로는 시험 간, 과목 간 난이도 차이를 반영하기 어렵기 때문에 원점수를 아래의 계산식처럼 표준화하여 입시에 반영한다.##
계산식
국어/수학 표준점수 = 20*((수험생 취득 원점수-응시 집단의 전체 원점수 평균)/응시 집단의 전체 원점수 표준편차)+100
사회/과학/직업탐구 표준점수 = 10*((수험생 취득 원점수-응시 집단의 전체 원점수 평균)/응시 집단의 전체 원점수 표준편차)+50
국어/수학 표준점수 = 20*((수험생 취득 원점수-응시 집단의 전체 원점수 평균)/응시 집단의 전체 원점수 표준편차)+100
사회/과학/직업탐구 표준점수 = 10*((수험생 취득 원점수-응시 집단의 전체 원점수 평균)/응시 집단의 전체 원점수 표준편차)+50
원래 표준점수는 만점이라는 개념 자체가 없다. 그러나 T점수는 일반적으로 20~80점 (3표준편차) 혹은 25~75점(2.5표준편차)를 벗어나는 값이 나올 확률은 매우 낮다. 수능에서는 5표준편차 구간인 0~200점을 범위로 하여 그 값을 벗어난 점수에 대해서는 0점 혹은 200점으로 절삭하여 제공한다.[5][6] 탐구 영역 및 제2외국어 영역은 0~100점을 그 범위로 하는데 상대평가 시절의 아랍어Ⅰ은 수능이나 평가원 모의고사에서 표준점수가 100을 넘겨 100점으로 절삭되는 경우가 비일비재했다.
산출식이 저렇기 때문에 원점수 평균을 m이라 하고, m점을 획득한 수험생이 있다면 (m-m)=0 이 되기 때문에 100점 혹은 50점이 된다. 즉 100점 혹은 50점은 표준점수의 절대 평균점이 된다. 이는 표준점수의 주요한 특징 중 하나이다.
보통 표준점수 최고점은 수학 나형>수학 가형≥영어>국어 순으로 높게 형성된다고 생각되었으나, 요새는 수학 가형의 평균이 상당히 오른 탓에(2018 가형 점수의 중앙값은 약 72점) 수학 나형≥국어>>수학 가형(영어는 절대평가)인 경향을 보인다. 수학 나형의 경우 수포자들의 존재로 인해 표준편차가 가장 크지만, 그만큼 평균이 워낙 낮게 잡히기 때문에 표준편차의 크기가 상쇄되어 표준점수 최고점이 보통 난이도에도 140점대 초반이 잡히고 쉬워봤자 130점대 후반은 나온다라고 알려져 있다.[7] 수학 가형의 경우 나형보다 평균이 높지만 대신 표준편차가 작고(수포자가 적고 중위권~중상위층이 두텁기 때문), 영어의 경우 평균이 국어, 수학, 영어 중 중간 정도이고(2013 수능 기준 약 56~57점) 표준편차가 수학에 비해 낮기[8] 때문에 표준점수 최고점이 비교적 높게 잡힌다.[9] 한편 국어의 경우에는 수학보다 평균이 높으면서 표준편차가 낮은 분포를 보이기 때문에 어려우면 130점대 후반~140점대 초반, 보통 130점대 초중반 정도에서 잡힌다. 쉽게 나오면 120점대까지도 떨어진다(평균이 올라가 Z점수가 떨어지므로). 그러나 2019학년도 수능에서는 역대 최고난도로 출제되어 표준점수 최고점이 150점에 달해 근 15년간 수능중에 가장 높은 표준점수를 찍었다. 단 최근 수학 영역이 쉽게 출제되는 경향으로 가형은 표준점수 최고점이 130점대 초반에서 잡히고 있고 나형도 웬만해선 130점대 후반에서 중반 정도로 잡히고 있다. 또한 영어는 아예 절대평가로 바뀌면서 표준점수가 의미가 없게 되었으며 탐구나 제2외국어는 워낙 들쭉날쭉해 예측이 힘들다.
7차 교육과정 수능이 사람들에게 엄청나게 까이는 이유가 바로 이것. 게다가 과목마다 난이도가 달라지기 때문에 탐구를 똑같이 만점을 받고도 같은 과목을 응시한 타 수험생들의 수준 차이에 따른 표준점수의 차이 때문에 어떤 과목을 선택한 사람은 합격하고 어떤 과목을 선택한 사람은 불합격하는 불상사가 생긴다. 또 다른 까임 원인은 매년마다 수능의 난이도가 일정하지 않기 때문에 표준점수라는 척도 자체를 신뢰할 수 없다는 것이다. SAT나 TOEIC 등 네임드 시험들은 보통 난이도 차이에 따라서 실력에 관계 없이 점수가 튀는 현상을 보정하기 위한 장치가 되어 있으나 수능에는 그런 장치가 전혀 없다는 것이 욕을 먹는 대표적인 원인 중 하나 그런데 이 부분은 어쩔수 없다. 원래 SAT는 1년 중 여러 번 실시하여 그 점수들을 보정하는 표준화 검사이다. 그런데 수능은 연 1회 단발성 실시에 그치기 때문에 점수 보정, 즉 표준화 작업을 진행할 수가 없다. 그렇다고 원점수를 제공할 수도 없는 것 아닌가? 바로 여기에 평가원의 딜레마가 있다. 특히 탐구 영역같이 과목별로 만점 표준점수가 크게 차이나는 경우 큰일이 벌어질 수 있다. 예로 2024학년도 대학수학능력시험 6월 모의평가의 경우 생명과학 1의 만점 표준점수(68점)과 지구과학 2의 만점 표준점수(98점)가 무려 30점이나 차이났는데, 이는 즉 생명과학을 아무리 잘하는 초굇수라도 과목 잘못 고른 죄로(...) 지2 선택자에 비해 30점의 감점을 안고 대학입시를 해야 하는 것이다. 이는 학생의 실력과 크게 상관없이 응시자의 표본 수준에 따라 표준점수가 크게 좌우되기 때문이기도 하다. 팀 협동전 게임에서 팀원을 잘 만나야 하는 것마냥 과목 내 응시자들을 잘 만나야 한다는 소리다... 물론 수능 때 이런 일이 벌어지면 그 해 입시가 한바탕 난리가 날 것이 자명하므로 대체로 수능 때는 표준점수 유불리가 크게 벌어지지 않도록 신경쓰는 편이긴 하다. [10]
이러한 문제를 해결하려면 수능을 1년에 최소 4회 이상 치르는 방법이 있다.[11]
다른 해결방법도 있는데, 이는 가산 점수제를 이용하는 방법이다.[13]
이런 표준점수의 특징 덕에 이를 잘 캐치하는 수험생들은 과목명, 백분위, 표준점수만 보고도 시험의 난이도와 표본집단의 수준을 대략적으로 추측할 수 있다.
한편 표준점수는 백분위보다 평균등급에 대한 정보를 좀 더 잘 반영하는 편으로 백분위는 과목별 편차가 커질수록 평균등급에 대한 왜곡현상이 심하게 발생하는데 표준점수는 그런 현상이 적어서 표준점수는 과목별 편차가 심한 학생들에게 유리하다. 실제로 등급제를 시행할때 중간에 해당하는 5등급에 많은 인원을 배정하고 1등급과 9등급에는 매우 적은 인원을 배정했기 때문에 정규분포를 가정하여 나타내는 표준점수와는 매우 호환성이 높다. 등급제의 등급배분도 정규분포를 감안하여 배정하였고 표준점수도 정규분포를 가정한 점수이기 때문에 상호 호환성이 높은 것이다. 그러나 백분위는 정규분포를 가정한 데이터가 아니다.[14] 그래서 과목별 편차가 심한 경우 백분위는 왜곡현상이 발생하게 된다.
2023년 기준 대다수의 대학이 국어, 수학에서는 이 표준점수를 그대로 대학별 환산점수에 반영하고[15], 탐구에서는 백분위를 대학 자체별로 환산한 변환표준점수를 반영한다. 예외로 서울대학교 등 일부 대학은 탐구 영역 역시 표준점수가 그대로 반영된다.
3. 고등학교 내신 성적에서의 표준점수
학생부종합전형 등에서 일부 대학들이 해당 학생들의 실질적인 학습 능력을 보다 정확히 파악하기 위한 용도로 사용하는 점수이다. 해당 학생의 내신성적 원점수는 해당 학교의 학습 수준이나 시험 난이도에 따라서 천차만별이기 때문에 표준점수를 사용해 그런 상황들을 감안하면서 학생의 상대적 수준을 수치화하였다. 고교등급제가 폐지됨에 따라 학교의 대략적인 수준을 파악할 수 없자 일부 대학들이 학생 선발과정에서 적용하였다.예를 들어 쉬운 내신 시험으로 인해 운 좋게 좋은 1~2등급을 받은 중하위권의 학생의 경우, 또는 서울 강남 8학군의 일반고 총합 내신 1.5와 지방 소재 중위권 이하 일반고 총합 내신 1.5가 같은 취급을 받는 것을 방지하기 위해서다.
물론 타 학교간의 비교뿐만 아니라 동일 학교 내 학생들에게도 적용할 수 있다. 따라서 표준점수를 적용하면 단순히 이수단위와 과목 등급만으로 총합 내신 등급을 산출한 동일 학교의 전교 2등이 전교 1등보다 좋은 평가를 받는 경우도 발생한다.
계산식
Z = (원점수 - 시험 평균) / 표준편차
Z = (원점수 - 시험 평균) / 표준편차
계산식에서 알 수 있듯이 z점수가 극대화되려면 (1)평균이 낮고 (2)표준편차가 작아야 한다. 즉, 해당 학교의 시험이 난이도가 어려움과 동시에 학생들의 점수 분포가 되도록 균일해야 하는 것이다.
[1] 엑셀에서 STANDARDIZE 함수를 이용하면 간단히 구할 수 있다.[2] 표준점수가 국영수는 0~200, 탐구영역은 과목당 0~100인 것이 이것 때문이다.[3] 편차란 평균에서 떨어진 정도를 의미한다[4] 자신의 원점수가 자신이 속한 집단의 원점수 평균보다 높으면 양수값이, 낮으면 음수값이 나온다[5] 하지만 이론상으로 표준점수가 5표준편차를 벗어나는 비율은 1,744,278명 당 1명뿐이다. 따라서 현재 40만 명 정도가 응시하고 있고 적정한 선에서 난이도를 관리하고 있는 수능에서는 이 점수가 발생하지 않는다고 봐도 무방하다.[6] 실제로 고2 전국연합학력평가 수리 나형에서 미친 난이도로 인해 2010년 6월(1컷55, 표준점수 207, 만점자 없음, 95점 이상), 2011년 3월(1컷54, 표준점수 214,만점자 없음, 91점 이상)의 경우 표준점수가 200점이 나왔다. 1997학년도 대학수학능력시험때에도 비공식적으로 만점 표준점수를 계산해보면 인문계 205점이 뜨기도 하였다![7] 다만 2018 수능 나형에서는 135점으로 정확히 130점대 중반이 나왔다.[8] 학력평가, 모의평가 기준 보통 23~25점대, 수능 기준 보통 21~22점대[9] 영어의 경우에는 2018 수능 이후 절대평가가 되었기 때문에 의미가 없어졌지만 상대평가 시절에는 보통 130점대 후반, 어려우면 140점대 초~중반 정도로 잡히곤 했다.[10] 국어, 수학 공통+선택 제도를 게임으로 예를 들자면 카트라이더 팀전으로 비유해볼 수 있는데, 내가 아무리 잘해도 팀원들이 못 하면 손해를 보는 구조이다.[11] 이게 실현된다면 본수능 이외의 3, 6, 9월 모의평가를 1, 2, 3차 수능으로 전환하고 대입 성적에 반영하는 방법이 최선일 것으로 보인다.[12] 학생들이 제일 힘들겠지만, 수능 1회 당 소모되는 물리적 비용과 사회적인 피로가 엄청나서 일반인들도 상당히 부담을 느낄 수 있다.[13] "수능표준점수제의 문제점 분석 및 대안개발" 단국대 정보컴퓨터학부 정보통계학 황형태 (2005.5.20)[14] 백분위는 단순히 등수에 대한 정보만을 제공할 뿐이며 평균에서 얼마나 많이 떨어진 성적인가를 나타내는 표준점수와 중간에서 얼마나 거리가 먼 집단에 해당하는가를 나타내는 등급과는 데이터의 성격이 다르다.[15] 단, 대학 및 학과에 따라 과목 별 가중치가 존재할 수 있다.