최근 수정 시각 : 2024-10-21 19:38:10

한자/SIP

파일:상위 문서 아이콘.svg   상위 문서: 한자
파일:漢.svg파일:漢_White.svg 한자
{{{#!wiki style="margin:0 -10px -5px; min-height:calc(1.5em + 5px); word-break:keep-all"
{{{#!folding [ 펼치기 · 닫기 ]
{{{#!wiki style="margin:-5px -1px -11px"
<colbgcolor=#eee,#333> 서체와 자형 갑골문 · 금문 · 전서 · 예서 · 해서 · 행서 · 초서 · 정자(표준자형) · 간체자(간체자 논쟁) · 신자체(목록 · 변화 규칙) · 본자 · 속자 · 약자 · 이체자 · 한중일 한자
성질과 분류 획(필순) · 구조 · 파자 · 육서 · 상형자 목록 · 훈음 · 부수 · 부수(중국) · 부수(설문해자)
표준화 상용한자 (한문 교육용 기초 한자 · 통용규범한자표 · 당용한자 · 일본의 상용한자 (목록) · 학년별한자배당표) · 한국어문회 한자검정시험 · 어문회 급수 · 대한검정회 한자급수자격시험 · 검정회 급수 · 한자한문지도사시험 · 인명용 한자표 · 광동어 정음 운동
주음·표음화·한자음 반절 · 주음부호 · 병음 (한어병음 · 월어병음) · 한글(동국정운) · 훈독 · 음독 · 속음 · 한국 한자음 · 중국 한자음 (문백이독 · 상고음 · 중고음 · 근고음 · 양안 간 독음) · 일본 한자음 · 베트남 한자음 · 다음자
옥편 자전 · 설문해자 · 강희자전 · 옥편 · 이아 · 운서 · 광운 · 절운 · 집운 · 오음편해 · 한어대사전 · 대한화사전 · 중문대사전 · 이체자자전 · 한한대사전
색인 부수별 · 음별 · 획수별
국가별 사용 한자문화권 · 한문 · 백화문 · 한국의 한자 사용 · 한자어(한국식 한자어 · 중국식 한자어 · 일본식 한자어 · 베트남식 한자어) · 언어간 동형이의 한자어(고유명사) · 언어간 이형동의 한자어 · 우리말 새김
파생 문자 한글 전 한국어 표기 (국자 · 이두 · 향찰 · 구결) · 방언자 · 주음부호 · 가나 (히라가나 · 가타카나 · 헨타이가나 · 만요가나) · 측천문자 · 쯔놈 · 고장자 ·거란 문자 · 여진 문자 · 서하 문자
입력 · 검색 한자/입력기 · 창힐수입법 (목록) · 오필자형수입법 · 대이수입법 · 사각호마검자법
전산화 KS X 1001 · KS X 1002 · KPS 9566 · GB 2312 · JIS X 0208 · Big5 / 유니코드: 한중일 통합 한자 · BMP(통합 한자 · 통합 한자 확장 A · 호환 한자) · SIP(통합 한자 확장 B~F) · TIP(통합 한자 확장 G) · 한자 모양 설명 문자
기타 고사성어 · 천자문 · 한시 · 어조사 · 음역 · 서예 · 올해의 사자성어 · 올해의 한자 · 국한문혼용체(논쟁) · 국한문병용체 · 한자 교육 (한문(교과) (2022 개정 교육과정/한문과) · 한자 교육 찬반 논쟁) · 중복 한자 · 벽자 · 통자 · 갖은자 · 한자오자 · 미상 한자 · 유령 문자 · 특이한 한자 · 닮은꼴 한자 · 국호 · 주기율표 · 음률 · 한자문화권 고유명사 표기 · 자주 틀리는 한자어 · 훈을 혼동하기 쉬운 한자 · 부수를 혼동하기 쉬운 한자 · 한자를 혼동하기 쉬운 단어 · 발음이 여럿인 한자어 · 한국의 성씨(인구분포 · 지역별) · 후리가나 · 창작 한자 }}}}}}}}}

유니코드 문자 집합의 문자 평면
{{{#!wiki style="word-break: keep-all; margin:0 -10px -5px; min-height:calc(1.5em + 5px)"
{{{#!folding [ 펼치기 · 접기 ]
{{{#!wiki style="margin:-5px -1px -11px"
<rowcolor=#FFF> 기본 보조
<rowcolor=#FFF> Plane 0
0000~FFFF
Plane 1
10000~1FFFF
Plane 2
20000~2FFFF
Plane 3
30000~3FFFF
Planes 4-13
40000~DFFFF
Plane 14
E0000~EFFFF
Planes 15-16
F0000~10FFFF
기본 다국어 평면
BMP
보조 다국어 평면
SMP
보조 표의문자 평면
SIP
3차 표의문자 평면
TIP
(사용 안 함) 보조 특수 목적 평면
SSP
사용자 자유 영역
PUA
0XXX 8XXX 10XXX 18XXX 20XXX 28XXX 30XXX 38XXX 문자 없음 E0XXX 15: PUA-A
1XXX 9XXX 11XXX 19XXX 21XXX 29XXX 31XXX 39XXX F0000-​FFFFF
2XXX AXXX 12XXX 1AXXX 22XXX 2AXXX 32XXX 3AXXX
3XXX BXXX 13XXX 1BXXX 23XXX 2BXXX 33XXX 3BXXX 16: PUA-B
4XXX CXXX 14XXX 1CXXX 24XXX 2CXXX 34XXX 3CXXX 100000-​10FFFF
5XXX DXXX 15XXX 1DXXX 25XXX 2DXXX 35XXX 3DXXX
6XXX EXXX 16XXX 1EXXX 26XXX 2EXXX 36XXX 3EXXX
7XXX FXXX 17XXX 1FXXX 27XXX 2FXXX 37XXX 3FXXX
}}}}}}}}} ||

1. 개요2. 상세

1. 개요

SIP는 사실상 한자 전용 평면이다. 평면 이름부터 보조 표의 문자 평면(Supplementary Ideographic Plane)이다.[1] 유니코드의 BMP 영역에는 이미 2만 7천여 자[2]나 되는 한자가 배당되어 있지만, 그것만으로는 부족하기 때문에 한자 전용 평면을 만든 것이다.

2. 상세

SIP의 한자는 현대에는 잘 쓰이지 않는다고 생각하기 쉬우나, 현대에도 잘 쓰이는 것들이 있다. 𠮟[3], 𠮷, 𥝱[4], 𩸽 등은 현대 일본어에서 쓰이고, 주기율표/중국어𬭊/𨧀, 𬭳/𨭎, 𬭛/𨨏, 𬭶/𨭆, 𫟼, 𬬭, 𫓧, 𫟷 등은 현대 표준 중국어에서 쓰이며, 𡃁, 𨋢 등은 현대 광동어에서 쓰인다. 심지어 한국의 인명용 한자 중에서도 𤨒(옥 이름 은) 등 몇몇 한자가 SIP에 실려 있다.[5]

단일 문서로 SIP의 모든 글자를 넣기에는 공간이 너무 부족해서 부득이하게 16개의 유니코드 하위 문서로 대체되었다. SIP는 UTF-8에서는 모두 4바이트 크기이다. 만약 이 문서 하나에 65,535자가 모두 들어가버리면 이 문서 하나 용량만 무려 262,140바이트+α262KB이다. 문제는 이걸로도 안 끝난다는 거.

[1] 그런데 한자는 표의 문자보다는 표어 문자로 분류하는 것이 적절하다. 순수히 뜻만 나타내는 글자도 있지만, 음이나 형태소를 나타내는 글자도 있기 때문. 다만 영역 이름과 문자 이름은 한 번 정해지면 절대 못 바꾸므로 이름을 고치기에는 이미 늦었다.[2] 65536자인 전체의 약42%[3] 일본의 2010년 개정 상용한자에는 U+53F1 叱(⿰口𠤎)이 아니라 U+20B9F 𠮟(⿰口七)이 들어갔다. 일본의 상용한자 중에서 유일하게 BMP가 아니라 SIP에 있는 한자다. 다만 SIP를 지원하지 않는 환경의 경우 U+53F1 叱도 사용 가능하다.[4] 다만 이 글자는 엄밀히 따지면 오탈자이다.[5] 거기에 더해 𰜩(물 이름 은; ⿰氵恩)은 BMP는 물론 SIP에도 없다. 유니코드 13.0이 되어서야 TIP의 U+30729에 추가되었다.