최근 수정 시각 : 2024-01-31 15:43:40

조합형 완성형 논쟁

한글 전산화
<colbgcolor=#dddddd,#212121> 한글 인코딩 조합형 · 완성형(한글 목록 · 중복 한자 · CP949) · 조합형 완성형 논쟁 · 남북한 한글 코드의 충돌 문제 · 한컴 2바이트 코드 · 한글 채움 문자() · 유니코드 · 옛한글
타자기 키보드 두벌식 · 세벌식(일반 자판 · 속기 자판) · 휴대전화 입력기 · 한영 키

1. 개요2. 상세
2.1. 전산화 초기2.2. CP949의 등장2.3. 유니코드 이후
3. 기타

1. 개요

한글 인코딩 방식을 두고 한때 PC통신 시절 하이텔 등 여러 통신망에서 일어났던 분쟁.

2. 상세

2.1. 전산화 초기

한글 자판을 입력하는 방식 중 조합형완성형 중 어느쪽이 더 나은가를 두고 논쟁했던 사건. 조합형 찬성파에서는 이쪽이 더 한글 창제 원리에 부합한다는 이유를 들었지만, 결국 1987년 2바이트 완성형(KS C 5601-1987, 現 KS X 1001:2004)이 먼저 국가 표준으로 지정되었고, 일부 제조사들의 컨소시엄으로 만든 조합형 한글 코드 표준, 일명 '상용 조합형'(KSSM, Korea Standard Specification Model)도 1992년에서야 복수 표준(KS C 5601-1992, 現 KS X 1001:2004 부속서 3)으로 지정되었다. 그러나 조합형이 태생적으로 각 컴퓨터 제조사들의 자체 한글 표기 포맷으로 발달해 왔기 때문에 완전히 호환되지 않는 독자 규격들이 난립하다가 결국 세를 통합하지 못하고 비주류로 남게 됐다.

이게 PC통신망에서만 논쟁했던 게 아니라 실제 기업들 업무에도 꽤 민감한 문제였다. 특히 1990년은 국내 기업들도 대기업은 대부분 전산화가 완료됐고 중소기업 등으로 종이 문서 기반 처리에서 전산화가 이루어지던 과도기 시기였는데, 당장 MBC 내부 전산망에 MBC의 인기 월화드라마 제목을 못 써넣는 사태가 그대로 뉴스에 나갔다. 물론 그 보도 프로그램도 조합형 완성형 논쟁을 심층 취재하는 과정에서 예시로 써먹은 거였다.

현재 인터넷에서 언급되는 글들에서는 '당시 정부가 한글 창제의 원리와 부합하는 조합형이 아닌 완성형을 성급하게 국가 표준으로 선택한 것이 오판'으로 설명하고 있는 경우가 있다. 그러나 완성형이 먼저 국가 표준으로 지정된 이유는 완성형은 국제 표준화 기구의 정보 교환용 부호 체계인 ISO/IEC 2022 표준을 준수하도록 설계되었지만 조합형은 그렇지 못해 행정 전산망 구축에 불리하다는 점이 가장 컸다. 당시 군사 정권에서 막 벗어난 시점이라 절차성을 중요시하는 지금과는 다르게 어마어마한 수준으로 효율성을 추구했기 때문에 효율적인 행정 전산망 구축을 위해 빠르게 국가 표준을 지정한 것이다.

2.2. CP949의 등장

이 논쟁은 마이크로소프트가 배정되지 않은 한글은 자리를 더 만들어 배정한다는 방식으로 해결을 시도했다.[1]

1995년 발매된 Windows 95마이크로소프트CP949라는 코드 페이지를 도입해서 어느 정도 정리됐다. 그러나 당시에는 이에 대해서도 논란이 있었다. 마이크로소프트에서는 완성형의 문제를 이전부터 인식하고 있었고, 이것의 한계를 넘기 위해 글자를 새로 정리하려 했는데, 기존 코드와 호환을 위해 추가 문자를 기존 완성형 코드가 사용하지 않는 영역에 배정했다.

파일:Cp949-map.png

CP949의 문제점은 기존 완성형과 새로 추가된 글자가 가나다순이 아니고, 심지어는 기존 완성형 사이 사이에까지 정렬되어 있기 때문에 단순히 코드만을 가지고는 가나다 순서대로로는 찾거나 정렬할 수 없었다는 점이다. 참고 이미지

한/글 97의 도움말에도 이와 관련된 내용이 있다. 참고 이미지

2.3. 유니코드 이후

이 분쟁이 완전히 사라진 것은 1996년 유니코드 2.0이 등장한 이후다. 유니코드 1.x대 버전에도 조합형 한글은 들어가 있었으나, 완성형 한글은 모든 글자를 수록하지 않는 등 엉망이었다. 2.0으로 버전이 올라가면서 한글 영역이 대이동, 완성형 형태의 조합 가능한 11,172자의 모든 한글 음절이 모두 들어갔다. 즉 유니코드를 쓰면 완성형이든 조합형이든 모두 호환할 수 있게 됐다. 이 덕에 조합형 완성형 논쟁이 끝났다. 그리고 간단한 수식을 통해 초중종성 분리가 가능한 유니코드의 특성상, 유니코드는 조합형의 특성에 더욱 가깝다고 볼 수 있다. 그리고 실제로 미리 지정된 11,172개 코드 말고도 초중종을 분리해 코드로 나열한 실제 과거 조합형과 매우 유사한 형태도 정식 유니코드 활용법으로 인정되기도 한다. Mac OS XHFS+ 파일 시스템은 이 방식을 표준으로 채택하는 바람에 맥에서 윈도우로 파일을 옮기면 소위 "자모 풀리는 현상"이 벌어지기도 한다.

3. 기타

이때 만들어진 유명한 문장이 '찦차를 타고 온 펲시맨쑛다리 똠방각하'인데, 조합형 지지측에서는 "이 문장은 완성형에서 쓸 수 없다"라면서 조합형의 우월성을 강조했다. 완성형에는 찦, 펲, 쑛, 똠이 포함돼 있지 않아서 쓸 수 없다. 완성형/한글 목록/KS X 1001 참고. 당시 방영했던 드라마인 똠방각하의 경우 TV 편성표상에서 '돔방각하'라고 표기하는 경우가 많았으며[2], 펩시콜라도 1992년 이전까지만 해도 한글 표기로 펲시콜라라고 했으나 완성형으로 펲시라고 표기할 수 없어서 1992년에 디자인이 리뉴얼 될 무렵에 펩시로 바꾸었다고 한다. 사실 '찦차, 펲시맨, 쑛다리'는 외래어라서 각각 '지프차, 펩시맨, 숏다리'라고 써도 문제가 없지만, 똠방각하는 고유명사이므로 대체할 단어가 없다.

위 문장을 예외 처리 없이 유니코드로 변환하면 완성형에 없는 글자(찦, 펲, 쑛, 똠)가 이상하게 바뀌는데, 가장 흔히 발생하는 경우로 '뾼차를 타고 온 최시맨과 뉵다리 馱방각하'가 있다. 그리고 완성형 체계에서 이 문장을 쓰려고 하면 "찌ㅍ차를 타고 온 페ㅍ시맨과 쑈ㅅ다리 또ㅁ방각하"라고밖에 안 써진다.

대표적인 조합형 기반 워드프로세서였던 한글과컴퓨터 아래아 한글은 1998년 당시 한글 815의 TV 광고에서 ''비행기가 날아간다 쓩"이라는 문장으로 아래한글의 우수성을 강조하였다.[3] 영상

당장 완성형으로는 모든 한국어 낱말조차도 입력할 수 없다. 그 일화 중 하나로 이영도가 하이텔에 퓨처 워커를 연재할 때에도 파의 외모에 대해 '도럄직한 몸매'라고 묘사했는데 완성형에는 '럄'자가 없어서 다른 글자로 대체해 적었다는 후기가 있었다. 또한 한국 고유종인 물고기 경모치도 '됭'자가 완성형 코드에 없어서 표현할 수 없었는데, 이 때문에 과거에 작성된 생물학 정보 홈페이지에서는 '?경모치'나 '경모치' 등으로 깨져서 나타난다. CP949조합형으로 작성한 글자를 웹 브라우저에서는 EUC-KR로 잘못 해석해서 발생하는 오류.[4]

이름에 들어가는 글자가 EUC-KR에 없는 경우에는 일상 생활 등에 지장을 줄 수도 있는데, 이는 업무 등에서 사용되는 시스템이 아직도 EUC-KR을 고집하는 경우가 많기 때문. 대표적인 예로 '설믜'라는 순우리말 이름을 가진 사람이 있다. 또한 워낙 심각한 문제이다 보니 국립한글박물관 기획전에서 비슷한 사연을 가진 분의 졸업증명서[5]가 전시될 정도였다.

게다가 세계화가 진전되고 정보통신 기술이 발전하면서 그에 따른 다양한 외래어외국어를 한글로 표기를 해야 할 일이 많아졌는데, 문제는 이런 글자 중에서 완성형에 없는 글자들이 많다는 것이다. 일본어의 예시[6]만 봐도 러브레터 감독으로 유명한 이와이 슌지는 당시에 이와이 '슈운지'로 알려져 있었는데, '슌'이 완성형에 없는 글자였기 때문. 또한 스즈미야 하루히의 우울을 발간할 때 이라는 글자 때문에 애로사항을 겪기도 했다.[7]


[1] 하드웨어 기술의 발전이 논쟁을 무의미하게 만들어버린 사례로, 어떻게 보면 모자라는 메모리 설계의 극복을 위한 himem.sys나 emm386 등의 눈물겨운 노력이 후대에는 1GB, 4GB, 32GB(!) 등의 대용량 메모리 출시와 함께 Windows 운영 체제도 더 이상 기본 메모리에 얽매이지 않게 되면서 사실상 무의미해진 것과 비슷하다.[2] 노래방의 경우 금영, 대흥 아리랑, ASSA 신바람 시리즈, 태진 뮤지콤 등에서 그렇다.[3] 이라는 글자는 완성형에 존재하지만, 쓩을 입력하는 과정에서 나오는 가 완성형에 없어서 입력하지 못했다.[4] 사실 공식적으로 조합형을 지원하는 웹 브라우저는 Mozilla 계열밖에 없다.[5] 이름 부분을 보면 '믜'에서 ㅣ가 분리되어 '서설므ㅣ'로 적혀 있는 것을 볼 수 있다.[6] 특히 일본 대중문화 개방 이후로 이러한 문제점이 드러나기 시작했다.[7] 이는 출판 작업 등에서 흔히 사용되는 QuarkXPress가 EUC-KR 밖에 지원하지 않는 오래된 버전이라는 점도 한몫했다.