최근 수정 시각 : 2024-04-18 11:28:42

유령 문자

파일:漢.svg파일:漢_White.svg 한자
{{{#!wiki style="margin:0 -10px -5px; min-height:calc(1.5em + 5px); word-break:keep-all"
{{{#!folding [ 펼치기 · 닫기 ]
{{{#!wiki style="margin:-5px -1px -11px"
<colbgcolor=#eee,#333>
서체와 자형
갑골문 · 금문 · 전서 · 예서 · 해서 · 행서 · 초서 · 정자(표준자형) · 간체자(간체자 논쟁) · 신자체(목록 · 변화 규칙) · 본자 · 속자 · 약자 · 이체자 · 한중일 한자
성질과 분류
획(필순) · 구조 · 파자 · 육서 · 상형자 목록 · 훈음 · 부수 · 부수(중국) · 부수(설문해자)
표준화
상용한자(한문 교육용 기초 한자 · 당용한자 · 일본의 상용한자 · 학년별한자배당표 · 통용규범한자표) · 한국어문회 한자검정시험 · 어문회 급수 · 대한검정회 한자급수자격시험 · 검정회 급수 · 한자한문지도사시험 · 인명용 한자표
주음·표음화·한자음
반절 · 주음부호 · 병음 · 한어병음 · 훈독 · 음독 · 속음 · 한국 한자음 · 일본 한자음 · 중국 한자음 · 상고음 · 중고음 · 양안 간의 독음 · 광동어 정음 운동 · 문백이독 · 다음자
옥편
자전 · 설문해자 · 강희자전 · 옥편 · 이아 · 운서 · 광운 · 절운 · 집운 · 오음편해 · 한어대사전 · 대한화사전 · 중문대사전 · 이체자자전 · 한한대사전
색인
부수별 · 음별 · 획수별
나라별 사용
한자문화권 · 한문 · 백화문 · 한국의 한자 사용 · 한자어(한국식 한자어 · 중국식 한자어 · 일본식 한자어 · 베트남식 한자어) · 언어간 동형이의 한자어(고유명사) · 언어간 이형동의 한자어 · 우리말 새김
파생 문자
한글 전 한국어 표기 · 국자 · 이두 · 향찰 · 구결 · 가나(히라가나 · 가타카나 · 만요가나) · 측천문자 · 방언자 · 쯔놈 · 고장자 ·거란 문자 · 여진 문자 · 주음부호
입력 · 검색
중국어/입력기 · 창힐수입법 · 사각호마검자법
전산화
KS X 1001 · KS X 1002 · KPS 9566 · GB 2312 · JIS X 0208 · Big5 / 유니코드: 한중일 통합 한자 · BMP(통합 한자 · 통합 한자 확장 A · 호환 한자) · SIP(통합 한자 확장 B~F) · TIP(통합 한자 확장 G) · 한자 모양 설명 문자
기타
고사성어 · 천자문 · 한시 · 어조사 · 음역 · 서예 · 올해의 사자성어 · 올해의 한자 · 국한문혼용체(논쟁) · 국한문병용체 · 한자 교육 찬반 논쟁 · 중복 한자 · 벽자 · 통자 · 갖은자 · 한자오자 · 미상 한자 · 유령 문자 · 특이한 한자 · 닮은꼴 한자 · 국호 · 주기율표 · 음률 · 한자문화권 고유명사 표기 · 자주 틀리는 한자어 · 훈을 혼동하기 쉬운 한자 · 부수를 혼동하기 쉬운 한자 · 한자를 혼동하기 쉬운 단어 · 발음이 여럿인 한자어 · 한국의 성씨(인구분포 · 지역별) · 후리가나 · 창작한자}}}}}}}}}


1. 개요2. 역사3. 수와 종류4. 유사한 사례

[clearfix]

1. 개요

[ruby(幽霊文字, ruby=ゆうれいもじ)]

일본컴퓨터 환경에서 입력할 수 있는 한자 중 그 유래나 출처, 상세한 쓰임이 밝혀지지 않은 미상 한자들을 일컫는 단어. 니코니코 대백과에서는 말 그대로 유령을 나타내는 한자라고 서술하고 있다.

2. 역사

일본의 통상산업성(現 경제산업성)은 일본어 표기에 쓰이는 문자들을 컴퓨터에서 표현하기 위해 1978년에 JIS 기본 한자(JIS X 0208, 당시 JIS C 6226)를 규정하였는데 JIS 규격의 한자 집합을 제정하는 과정에서 출처를 알 수 없는 글자들이 등록되었다. 이는 한자에 대한 지식이 부족한 작업자가 착각했거나 미세한 획을 잘못 입력하는 등 전산화 작업에서의 사소한 오류로 인해 발생했다고 여겨진다.

이 문제가 부상하면서 일본 국립 국어 연구소(国立国語研究所)의 사사하라 히로유키(笹原宏之) 등이 조사를 시작해 이 한자들이 지명으로 사용되거나 자료를 전사하던 중에 발생한 착오라고 여겨진다는 사실을 판명했다. 이 연구 결과는 JIS X 0208:1997의 부록 7에 정리되어 있다.

1997년의 JIS 한자 개정의 일환으로 사사하라 히로유키를 비롯한 연구진이 유령 문자에 대한 조사를 벌였지만 이 시기에는 이미 유니코드에 JIS 한자가 수록되었기 때문에 JIS를 섣불리 개정할 수 없었다.[1] 일본은 2000년에 JIS X 0208을 확장한 일본어 문자 집합인 JIS X 0213을 만들었는데 여기서도 JIS X 0208 부분은 건드리지 않고 그대로 뒀기 때문에 최신 일본어 문자 집합 JIS X 0213에도 유령 한자는 그대로 남아 있다. 사실 아래의 연구 결과를 보면 알 수 있듯 착오로 만들어진 진짜 유령 문자는 총 8자로(穃, 墸, 壥, 妛, 挧, 暃, 袮, 彁) 문자 집합을 함부로 건드릴 정도로 심각하진 않다.

3. 수와 종류

1997년 당시로서는 이런 글자가 얼마나 되는지 정확히 추산할 수 없었는데 지명·인명용 한자로 국자가 쓰이는 경우는 한국에서도 乭이나 乷 등이 쓰이는 등(예: 이세돌 李世, 살미면 味面) 한자문화권에서는 일반적인 일이었기 때문에 자전에 나오지 않는다고 무작정 없는 한자라고 단정할 수는 없었기 때문이다.[2][3] 최초연구가 시작될 때는 대개 60자에서 100자 정도로 추산되었다.

이후 연구에서 역시 대부분이 연구 결과 폐번치현 이전 혹은 현재도 쓰이는 지명·인명용 한자임이 밝혀졌고 열두 자를 제외하면 대부분 그 출처가 확인되면서 유령 한자가 아님이 드러났다. 이 과정에서 밝혀진 글자들은 다음과 같다.
과거 혹은 현재에도 지명·인명으로 사용되는 한자로 밝혀진 경우
すくも(스쿠모)라고 읽는 지명용 국자임이 확인되었다. 여전히 히로시마현 아키타카타시에는 [ruby(糘地, ruby=すくもぢ)](스쿠모지)라는 지명이 있고 오카야마현 츠야마시에는 [ruby(糘山, ruby=すくもやま)](스쿠모야마)라는 산이 있다.
ゆき(유키)라고 읽는 지명용 국자임이 확인되었다. 과거 구마모토현 미나마타시에 [ruby(膤割, ruby=ゆきわり)](유키와리)라는 지역이 있었다.[4]
うるち(우루치)라고 읽는 지명용 국자임이 확인되었다. 과거 후쿠시마현 시라카와시에 [ruby(粫田, ruby=うるちだ)](우루치다)라는 지명이 있었다. 현재는 [ruby(糯田, ruby=もちだ)](모치다)로 변경되었다.
ほう(호)라고 읽는 지명용 국자임이 확인되었다. 아이치현 토요타시에 [ruby(垉六, ruby=ほうろく)](호로쿠)라는 지역이 있다.[5]
이 글자는 일본에서 やま(야마)라고 읽는 지명용 한자임이 확인되었다. 교토부 교토시 사쿄구에 [ruby(広岾, ruby=ひろやま)](히로야마)라는 지명이 존재했지만 현재는 [ruby(広帖, ruby=こうちょう)](코쵸)로 변경되었다. 이 글자는 한국에서도 비슷한 의미로 사용되는데 옥편에는 '땅 이름 점[6], 고개 재'[7] 2가지로 등록되어 있다.
だる(다루)라고 읽는 지명용 국자로 확인되었다. 시즈오카현 시즈오카시 아오이구에 [ruby(石橸, ruby=いしだる)](이시다루)라는 지역이 있는 것이 확인되었다.
ぬた(누타)라고 읽는 지명용 국자[8]로 확인되었다. 야마나시현 카이시에 [ruby(大垈, ruby=おおぬた)](오누타), 후에후키시에 [ruby(藤垈, ruby=ふじぬた)](후지누타)라는 지명이 있다. 다만 특이하게도 한국에서는 아주 많이 쓰이는 글자여서[9] 어문회 기준으로 2급 한자라는 급수가 부여되어 있다.
ぬた(누타)라고 읽는 메이지 시대에 지명에 사용되었던 국자였다. 고치현 시만토초의 [ruby(汢の川, ruby=ぬたのかわ)](누타노카와)라는 지명에 사용되었는데 현대에는 삼수변이 이수변으로 바뀐 또 다른 국자를 사용 중이다. 이 冫土는 반대로 JIS에 없으며[10] 심지어 유니코드에도 없다. 결국 이러한 이유로 인해 해당 지명은 2002년 다시 汢の川로 표기가 바뀌었다(...).[11] 한국 옥편에는 '물 이름 토' 자로 등록되어 있다.
せき(세키), ひろ(히로)라고 읽는 인명용 한자로 확인되었다. 碩의 이체자로, 실제로 현대에도 이 한자를 쓰는 사람이 존재함이 확인되었다.[12][13]
ぬか(누카)라고 읽는 지명용 한자로 확인되었다. 아키타현 아키타시에 [ruby(粐蒔沢, ruby=ぬかまきざわ)](누카마키자와)라는 지역이 존재한다.
어디서 나온 오자(誤字)인지 명백하게 밝혀진 경우.
오키나와현 오키나와시의 [ruby(榕原, ruby=ようばる)](요바루)의 榕이 잘못 전사된 것으로 확인되었다. 두 글자의 변을 보면 벼 화(禾)와 나무 목(木)은 딱 한 획 차이라서 다른 한자의 구성 요소로 쓰일 경우 혼동하기 쉽다. 원래 글자 榕의 한국식 훈독은 "벵골보리수 용"이다.
그러나 조사 후에도 열두 자는 한동안 출처가 밝혀지지 않았는데 이러한 글자들은 강희자전 등 주요 자전에 실려 있지 않는 등 출처를 파악할 수 없었으며 어디에서 쓰이는지조차 알려져 있지 않았고 어떻게 읽어야 하는지도 알 수가 없었다.

墸 壥 妛 彁 挧 暃 椢 槞 蟐 袮 閠 駲

추가 연구를 통해 열두 자 중 한 자를 제외한 열한 자도 어디서 발생한 오자인지 혹은 어디서 쓰이는지 밝혀졌는데 연구 결과는 다음과 같았다.
출전은 알 수 없으며 堵의 오자(誤字)로 추정된다.
㕓의 부수를 쉽게 찾을 수 없자 土변을 넣은 글자...라고 알려져 있었으나 몽구집주(蒙求集注)[14]라는 책에 밭을 세는 단위를 나타내는 글자로 쓰인 것이 확인되었다. 여기에서 Ctrl+F로 壥을 찾을 수 있다.
𡚴(⿱山女)의 오자로 추정된다. 𡚴(⿱山女)는 あけび(아케비)라고 읽는 일본 국자인데 한 책에서 이를 妛로 잘못 표기한 것이 유래로 확인되었다.[15]
국토지리협회 국토행정총람지에서 등장한 글자로, 栩의 오자다.
국토지리협회 국토행정총람지에서 皐, 星, 早, 毘, 昆, 犀, 韮, 晃, 昌, 昇 등 매우 많은 한자들의 오자로 사용되었다.[16]
토쿠시마현 나루토시에 [ruby(椢原, ruby=くにはら)](쿠니바라), 이바라키현 다이고마치에도 해당 글자를 쓰는 [ruby(椢内, ruby=くぬぎうち)](쿠누기우치)라는 지역이 있다. 따라서 지명용 국자로 확인되었다.[17]
櫳의 약자로 확인되었다.[18]
인명에 쓰였던 한자로 확인되었다. 음독은 トウ(토), ドウ(도), ジョウ(조), 훈독은 かまきり(카마키리)[19], もみ(모미).
돗토리현 돗토리시의 [ruby(祢宜, ruby=ねぎ)](네기)라는 지명의 示변이 衣변으로 착각된 한자로 확인되었다.[20]
일본에 전해진 광운상에 통자 관계로 설명되어 있다. 閏의 속자다.[21]
'말꼬리 주'라고 하는 인명용 한자. 강희자전에는 누락되어 있으나 사성음이 존재하며[22] 일본 음독은 シュウ(슈)로 확인되었다.

결국 '최후의 유령한자'라고 불리는 '彁' 한 자만 남게 되었지만 몇십년 후 본 한자가 제목으로 쓰인 곡이 유명해지면서 무엇의 오자인지 밝혀졌다.
아사히 신문의 1923년 2월 23일자 기사 중 사이타마 자강회(埼玉自彊会)의 彊(굳셀 강) 자가 뭉개져 찍혀 彁로 보이게 된 것으로 확인되었다.#[23]


유령문자 자원(字源) 풀이

4. 유사한 사례

전 세계의 문자를 담는 것을 목표로 하는 유니코드에서도 비슷한 사례가 있다. 예를 들어 ⍼(U+237C)이라는 기호는 유니코드에 등재되기 전까지 기록된 용례가 없었으며 왜 유니코드에 추가되었는지조차 불명이다.그래프 같아 보이는데


[1] 심지어 한국에서도 이미 유령 문자를 한컴 2바이트 코드 시절인 한/글 97 기능강화판부터 입력 가능했다.(대개 변환을 누르면 입력할 수 없고 문자표에서만 쓸 수 있는 문자. 물론 후술하듯이 변환해도 입력할 수 있는 문자도 있다.) 지금도 밑에 있는 유령 한자를 아래아 한글에 복붙하여 신명조와 같은 몇몇 아래아 한글 전용 폰트로 바꾸면 글꼴이 바뀌는 것을 볼 수 있다.[2] 한자는 기본적으로 열린 집합이다. 제작 원리만 알면 누구나 당장 새 한자를 만들 수 있다. 실제로 鿫(⿹气奥, 오가네손 오, 파일:Rf-Og_zh-hans.png) 등의 새로이 만들어진 한자들이 있다.[3] 역사적으로는 측천문자가 대표적인 사례다.[4] 그러나 해당 지명이 정확히 어디를 가리키는 지는 불명으로 보인다. 한편 미나마타학 연구센터에서는 예로부터 미나마타 제2소학교 일대를 일컫는 지명이라고 소개하고 있으며 읽는 방법도 すねわり(스네와리)로 제시하고 있다.[5] 한국 옥편에는 '캘 포' 자로 등록되어 있다.[6] 인천광역시 강화군 하점면(河岾面)의 '점'자가 바로 이것이다.[7] 고개를 뜻하는 '재'는 순우리말인데 한자로 표현하기 위해 이 글자를 사용한 듯하다. 재를 뜻하는 다른 한자로는 고개 치, 고개 령(嶺) 등이 있다.[8] 한국에서도 국자로 취급된다.[9] 서울 낙성대(落星垈) 등의 지명에도 쓰이거니와 한국 부동산등기부에서 토지의 사용 목적을 나타낼 때 사용하는 축약어(지목) 중 주택용지(또는 사무용 건물 필지)를 나타내는 것이 바로 垈(대)이다. 단국대학교 한국한자어사전에 따르면 원래는 代를 집터란 뜻으로 가차하여 사용하였으나, 밑에 土를 덧붙여 의미를 더 확실히 했다고 한다.[10] JIS 한자 코드(JIS漢字コード)는 일본 공업 규격의 한자 등의 문자 코드이다. 쉽게 말해서 옛날에는 삼수변(氵)을 썼는데 현대에 이수변(冫)으로 바뀌어서 쓰이고 있다. 그런데 막상 이수변(冫)과 흙 토(土)로 된 문자(⿰冫土)는 인터넷상의 문자에 없다는 것이다.[11] 바뀐 것에는 컴퓨터로 입력하기 불편하단 이유 외에도 본래 汢 쪽을 사용했고 공신력 있는 사전인 다이칸고린에서도 삼수변이 붙은 한자를 사용했다는 이유도 있었다.[12] 덧붙여 이런 식으로 인명용으로 쓰인 국자는 한국에도 상당히 많은데 각 집안 족보를 들여다보면 제법 찾을 수 있을 정도다. 하지만 후대 연구 등에서 나타날 경우 전공자들의 머리를 쥐어뜯게 만든다.[13] 한국 한자음으로는 어째선지 "석"이 아닌 "정"으로 등록되어 있다. 이체자가 아닌 형성자 원리에 따라 石+貞으로 보아 "정"으로 임의로 붙인 듯하다.[14] 몽구(蒙求)는 중국 당나라 이한(李翰)이 지은 어린이들의 문자 교육을 위한 아동용 교재이고 몽구집주는 사고전서에 수록된 책으로 논어집주와 마찬가지로 후대의 학자가 주석을 달아놓은 책.[15] 한국 옥편에는 '더러울 치' 자로 등록되어 있는데 보통 '치'자는 위에 山이 아니라 屮의 형태다. 하지만 山으로 나온 문헌도 있긴 하다. #[16] 한국 옥편에는 '떠날 비' 자로 등록되어 있다.[17] 한국 옥편에는 '광주리 밑바닥 귀', '광주리 괴' 자로 등록되어 있다. 옥편에 따라서는 槶를 올린 다음 椢를 槶의 약자로 풀이하였을 것이다.[18] 이 용 룡()의 약자다.[19] 사마귀라는 뜻인데 같은 뜻의 한자로 사마귀 당(螳)이 있다. 이 글자의 오기로 보인다.[20] 示가 변으로 쓰일 때는 가타카나 ネ(네)와 같은 모양(礻)으로 쓰이기도 하는데 衣가 변으로 쓰인 모양(衤)과 비슷해서 착각하기 쉽다. 한편, 한국 옥편에는 '꿰맬 치' 자로 등록되어 있으며 祢는 '아비 사당 녜/니' 자로 등록되어 있는데 히라가나 ね의 뿌리이기도 하다.[21] 대한민국에서도 같은 용례로 쓰인다. 옥편에도 당연하다는 듯 '윤달 윤'으로 등록되어 있다. 특히 潤(젖을 윤)이 이름자로 들어간 많은 사람들이 氵閠의 형태로 쓴다.[22] zhou로, 우변의 고을 주에서 파생된 것으로 보인다.[23] 유령 문자들 중에서 제일 오랜 기간 동안 그 출처가 밝혀지지 않았던 문자였다. 2011년 아사히 신문 디지털 매거진에서 처음 확인되었는데 근 10년이라는 기간 동안 이 주장이 묻혔다가 동명의 악곡이 유명해진 다음에야 이 사실이 재발굴되었다.