최근 수정 시각 : 2024-10-26 06:42:17

다중 문자

1. 개요2. 용어에 관하여
2.1. 번역어
2.1.1. '문자'라는 용어의 중의성
2.2. 비슷한 단어
3. 종류4. 구별
4.1. 합자4.2. 음소 연쇄(이중음)4.3. 묵음4.4. 장음중복 자음
5. 원인
5.1. 기능적인 한계5.2. 역사적 언어 변화5.3. 외래어 표기 전사
6. 단점
6.1. 발음의 자의성6.2. 음절 구분의 어려움6.3. 두문자어 축약의 애매함6.4. 글자 수 증가
7. 발음
7.1. 언어별 차이
8. 그 외 표음문자에서9. 목록

영어 위키백과: Digraph (orthography) / 한국어 위키백과: 이중음자
영어 위키백과: Multigraph (orthography) / 한국어 위키백과: 다중음자

1. 개요

/ multigraph

다중문자란 두 개 이상의 문자열로 하나의 음소를 나타내는 것을 뜻한다. 영어에서 'th'로 쓰고 [θ]라고 읽는 것이 그 예. 두 개 이상의 문자를 쓰더라도 각각의 문자에 해당하는 음소를 모두 읽어주면 다중문자라고 부르지 않는다. 예컨대 영어에서 'tr'와 같은 표기는 (비록 /t/가 변하긴 하나) /tr/로 각각 읽히는 자음군이므로 다중문자가 아니다. 한편, 베트남어에서는 같은 표기 'tr'을 /tʂ/로 발음하기 때문에 다중문자이다.[1]

일반적인 음운 연쇄를 표기한 것에 대해서는 '연속자'(連續字, blends)라는 표현을 쓴다.

2. 용어에 관하여

앞에 붙는 숫자는 그리스어 접두사를 사용해 'digraph, trigraph, tetragraph, pentagraph...' 식으로 올라간다. 이것들을 포괄해서 다중문자라고 하기는 하지만 대부분은 이중문자(digraph)이며 삼중, 사중문자부터는 지극히 적다. 영문 위키백과에서는 칠중문자(heptagraph)까지 예를 들고 있는데 러시아 문자 'щ'를 독일어에서 'schtsch'로 적은 것을 소개했다. 이곳 나무위키에서도 'digraph'라는 단어는 열 개의 문서 정도에서 간간히 나타나지만 'trigraph'부터는 전혀 나타나지 않는다.[2] 역링크digraph 문서 쪽에도 많은 편이다.

프랑스어로는 'polygramme'이라고 한다. ' digrammes, trigrammes, quadrigrammes' 식. '-graph'가 '-gramme'에 대응되는데, 재미있게도 이 둘은 일단 같은 어원을 공유하기는 한다.#

2.1. 번역어

digraph, trigraph, (…) multigraph에 대응하는 학술적 차원의 번역어는 아직 하나로 정해져있지 않다. 이들 단어는 표기와 관련된 개념이라 언어학의 핵심과는 다소 거리가 있기 때문이다.[3] 기존 연구/출간물에서의 용어 사용 실태는 다음과 같다.
  • 이상억(2011), "성씨의 로마자 표기 성씨의 로마자 표기 정책 마련 연구"#: 112쪽 40번 주석에서 '두 글자(digraph)'라는 용어를 사용하였다.
  • 2018년 국립한글박물관 연구 보고서 "한글과 동아시아 문자 비교 연구(다년도연구-3차)"#(자동 다운로드): digraph의 번역어로 '이중문자'와 '이중글자'라는 표현을 혼용하고 있다.
  • 오지은(2018), "중국계 다문화 가정 학습자의 오류 양상을 고려한 맞춤법 교육"#: '이중자음'이라는 용어를 사용하였다.

때문에 번역어와 관련하여 다음과 같은 가능성이 있을 수 있다. 각 항 아래 줄에 부기된 것은 해당 번역어가 지니는 한계점들이다.
  • 여러 글자라는 의미만을 담은 용어
    아래 번역어들은 아래에서 제시될 '-음자', '-합자'와는 달리 단어 안에 "하나의 음을 가리킨다"나 "합쳐져 있다"와 같은 정보가 담겨 있지 않다. 그러나 이는 'multigraph'라는 단어 역시 지니고 있는 특징이다.
    • 다중자(多重字)
      발음 안내 책 같은 데서는 '이중자(二重字)'라는 표현을 쓰기도 한다. 자음이면 '자음 이중자'(consonant digraph), 모음이면 '모음 이중자'(vowel diagraph)라고 부르는 식. #1 #2 다음 영어사전에서도 '이중자'라는 풀이를 제시했다.
      • 한자 표기 없이 '다중자'라고 하면 '다중-자'의 분절이 눈에 잘 띄지 않아 '-자'(字)를 인식하기 어렵다.
    • 다중문자(多重文字)
      • 아래에서 다룰 '문자'라는 단어의 중의성 때문에 여러 종류의 문자 체계를 사용하는 것(다중문자체계)으로 오해할 여지가 있다.
    • 다중글자(多重글字)
      네이버 영어사전에서는 '이중 글자'로 풀이하였다.
      • 위 '다중문자'의 중의성을 해소할 수 있다는 장점이 있으나 '글자'라는 단어가 (혼종어라는 한계 때문인지) 다소 구어적인 면이 있어서 본격적인 번역어로 쓰기에 심적인 부담이 있다.
    • 여러 글자
      • 위에서 보듯 실제로 digraph를 '두 글자'로 번역한 예가 있다. 사실 두 글자 중 "하나의 음을 나타낸다"라는 속성이 있는 것을 digraph라고 하니 크게 틀린 표현은 아니다. 다만 순우리말 수식어를 쓴 특성 탓에 하나의 개념을 나타내는 학술 용어로 인식하기가 좀 어렵다는 심적인 부담이 있다.
  • multigraph의 특성을 드러낸 용어
    • 다중음자(多重音字)
      한국어 위키백과에서는 'digraph, trigraph... multigraph'를 '이중음자, 삼중음자... 다중음자'로 번역한다.
      • 일반으로 한국어에서 '이중, 삼중... 다중'은 후행하는 단어에 해당하는 개념의 개수가 여러 개인 것을 의미하기 때문에(ex: 다중 계정 - 계정이 여러 개인 것을 의미함) '다중음자'라고 하면 음이 여러 개인 것으로 오인될 소지가 있다. 실제 multigraph는 글자 수는 여러 개일지언정 음은 대개 1개만을 나타낸다.
      • 그러한 문제가 있더라도 기존의 번역 관례가 있다면 따르는 것이 타당하겠으나 이 번역어가 얼마나 널리 사용되는지는 확인하기 어렵다.
    • 다중합자(多重合字)
      '이중합자', '삼중합자' 등 '합자(合字)'라는 표현을 쓰기도 한다.
      • 무엇을 합자로 보는가가 다양할 수 있다. 합자의 기준에 관하여서는 문서 참고. '합자'는 활자 자체가 합쳐진 것에 대응되는 경우가 많아 혼동될 수 있으며, 특히 한글이라는 문자 체계에서는 합자를 다양한 단계에서 정의할 수 있기 때문에 더욱 혼란스러운 면이 있다.
  • 철자를 강조한 용어
    • 다중철자(多重綴字)
      여러 글자가 하나의 표기법으로서 한 음소를 나타낸다는 면에서 '다중철자(多重綴字)' 같은 말을 쓸 수도 있다.
      • [색]을 의미하는 영단어의 철자가 'color' 혹은 'colour'인 등 한 단어의 철자 방식(spelling)이 여러 개인 것을 의미하는 것으로 오인될 수 있다.
    • 다철일음자(多綴一音字)
      '동형이의어' 식으로 굳이 말을 만들자면 '다철일음자(多綴一音字)' 식으로 쓸 수도 있다.
      • 단, 선행하는 한자 없이 '-자'(字)라고만 쓰면 문자열이 아닌 낱개 문자를 가리키는 것으로 오해를 살 여지가 있다.
  • 기타
    • 연자(連字)
      다음 영어사전은 digraph에 대하여 앞서 언급한 '이중자', '합자' 외에도 '연자(連字)'라는 풀이를 싣고 있다.
      • 다소 생소한 데다가 '연속자'라는 단어를 음운 연쇄 표기에 대해서 쓴 사례가 있어서 상충될 우려가 있다.
    • '다이그래프'로 음차
      다양한 번역어가 있지만 의외로 '다이그래프', '멀티그래프'와 음차어는 잘 쓰지 않는 듯하다. 아무래도 '그래프'라고 하면 수학 용어라는 이미지가 강해서 그럴 수도 있겠다.

본 문서는 위키의 특성상 새로운 용어를 창안하기는 어려우므로 최대한 원문에 기대어 'multi'와 'graph'를 단순 직역한 번역차용어인 '다중문자'라는 용어를 사용하겠다.

2.1.1. '문자'라는 용어의 중의성

한편 'digraph'와 'digraphia'에서도 보듯이 '문자'에는 두 가지 의미가 있어 이 역시 고려할 필요가 있겠다. 'digraphia'와 'digraph'는 둘 다 '이중문자'로 번역될 수 있다. '문자'라는 단어가 "글자 하나하나"를 뜻하기도 하고,[4] "글자를 쓰는 시스템(문자 체계)"을 의미하기도[5] 해서 그렇다.[6] 'digraph'일 때에는 전자의 의미로 쓴 것이고, 'digraphia'는 후자의 의미로 쓴 셈이다. 오늘날에는 글자 수를 셀 때는 "300 글자 내로 쓰시오" 식으로 말하는 등 '문자'라고만 하면 후자(문자 체계)의 의미가 더 강하기는 하다. 한편 '글자'라는 단어에는 "문자 체계"라는 뜻이 없기 때문에 이러한 중의성을 피할 수 있다.

다만 한자어는 접사가 부족하기 때문에 이 정도 중의성은 불가피한 면이 있다. 일례로 '대통령(大統領)'이라는 단어는 엄밀히 '대통령 직책'이라는 것과 '현재 대통령인 사람'으로 나누어지며 영어로는 이를 'presidency'와 'president'로 구분하지만 한자어로는 대체로 둘을 구분하지 않는다. 그런 점에서 'digraph'와 'digraphia'도 'graph'라는 같은 어근을 공유하는 단어이므로 한자어로 번역했을 때 형태가 같아지는 것도 어쩔 수 없다고 볼 여지가 있다.

일단 이 문서에서는 '문자'라는 단어를 주로 사용하되, 문자 체계와 문자 하나하나가 혼동될 수 있는 경우에는 후자에 대해서 '글자', '낱글자' 등의 단어를 사용하였다.

2.2. 비슷한 단어

'digraphia'(이중문자체계)는 'digraph'(이중문자)와는 개념이 좀 달라서 어느 한 나라에서 같은 언어를 두 개 이상의 '문자 체계'로 표기하는 것을 의미한다. 한편 표기에서 벗어나 언어까지 달라지면 'diglossia'(양층 언어), 'bilingualism'(이중언어) 등으로 지칭한다. 이들은 언어에 관련된 것으로, 표기법에 관련된 이 문서와는 전혀 무관하다.

'multigraph'라는 말은 언어 및 표기 외의 전혀 다른 분야에서도 쓰인다. 수학그래프 이론에서는 두 개의 점이 있을 때 그 사이에 두 개 이상의 선이 존재하는 것을 허용하는 그래프를 'multigraph'라고 한다. 이 용어는 한국어로 보통 '다중(多重) 그래프'라고 번역한다. 이 문서에서의 'multigraph'와는 달리 'multigraph'가 아닌 것은 그냥 '단순 그래프'(simple graph)라고 하지, 개수에 따라 'digraph'니 'trigraph'니 하는 말을 쓰진 않는다. 방향 그래프(directed graph)를 간혹 'digraph'라고 줄여 말하긴 하는데 이 문서에서처럼 '2'를 뜻하는 것으로 쓴 것은 아니다.

'다중문자'라는 말은 치환암호에서 'polyalphabetic'의 번역어로도 쓰인다. 반댓말은 'monoalphabetic'(단일문자). 내용상으로는 이 문서와 전혀 무관하다.

3. 종류

같은 글자가 두 번 쓰일 경우 동형다중문자(同形多重文字, homogeneous multigraph)라고 하고, 이는 (두 글자일 경우) 대체로 '중복 글자(doubled letter)'이라고 부른다. 다른 글자가 두 번 쓰일 경우 이형다중문자(異形多重文字, heterogeneous multigraph)라고 한다.

영어의 자음은 동형다중문자가 잘 나타나지 않는 것이 특징이다. 모음에서는 'ee[i:]', 'oo[ʊ]/[u:]'과 같은 것이 나타난다.

대다수 다중 문자는 연속된 문자열이지만 분리된 다중문자(split digraph)도 있다. 대표적인 예는 영어에서 '모음 + (중간의 다른 자음) + e'가 장모음(으로 간주되는 음)[7]으로 읽히는 것을 들 수 있다.[8]

4. 구별

4.1. 합자

여러 개의 문자로 하나의 음소를 나타내는 것이 다중문자의 정의이므로, 인식상 하나의 글자로 여겨진다면(인식상 합자) 더 이상 다중문자로 볼 수 없을 것이다. 그런데 이 때 합자의 기준을 무엇으로 보는가에 따라서 다중문자의 범주가 달라질 수 있다.

합자의 기준에 대해서는 문서 참조.

4.2. 음소 연쇄(이중음)

음소문자에서 하나의 음소는 하나의 글자로 나타내는 것이 일반적이기 때문에 두 개의 문자를 겹쳐 적으면 두 개의 음소가 연속해서 발음되는 것(음소 연쇄)처럼 오인될 수 있다.

프랑스어스페인어에서는 다중문자와 이중음을 구분하기 위해서 diacritic 중 하나인 tréma(◌̈)를 사용하기도 한다. 예를 들어 프랑스어에서 oe는 '' 비슷하게 읽는데, Noël(크리스마스)은 '뇔'이 아니라 '노엘' 비슷하게 읽는다. 스페인어에서 gue 및 gui는 각각 [ɡe], [ɡi]처럼 읽는데, lingüística(언어학)은 '링구이스티카' 비슷하게 읽는다.

한글에도 글자가 여러 개 겹쳤을 때 다중문자인지 단순한 음운 연쇄인지 혼동을 불러일으킨 적이 있었다. 예컨대 ㅅㄱ, ㅅㅂ과 같은 ㅅ계 합용병서가 ㅅ과 ㄱ을 함께 표기한 것인지, 된소리를 표기한 것인지는 지금까지도 논란의 대상이다. 한글을 개량해 외국 음을 표기하자는 주장에서도 "[f]를 ''로 쓰자" 등 다중문자의 제안이 꽤 많은데 이때도 다중문자와 음운 연쇄를 혼동할 여지가 꽤 있다고 볼 수 있다. 한글은 병서와 연서로 철자 방식이 두 가지가 있으므로 다중문자일 때에는 ''식으로 연서하는 걸로 구분할 수도 있겠다.

근대기의 한글 개량 표기에서는 다중문자와 음운 연쇄의 표기가 모두 등장한다. 'drink'[drɪŋk] 같은 것을 적기 위해서 굳이 'ᅞᅵᇯ'와 같이 'ㄷㄹ'를 사용한 것은 음운 연쇄를 표기한 것이지만, ''[t͡sɯ̹̈]의 표기를 위하여 'ꥢᅳ'를 사용한 것은 다중문자의 예이다.[9]

4.3. 묵음

본래대로라면 음소 연쇄로 발음되어야 할 문자 배열 중 하나가 묵음인 경우 하나의 음만이 남으므로 위의 정의로는 모든 묵음이 다중문자에 속하게 된다. 그러나 한편으로 묵음인 글자의 발음이 ∅에 대응된다고 처리하면 각각의 문자가 각 음에 대응되는 것이므로 다중문자가 아니게 된다.

이 때문에 묵음이 되는 조건이 중요하다. 영어 라틴 문자 규칙에서 'k'는 'kn'의 배열인 조건에서만 묵음이기 때문에 'kn'이라는 배열이 [n]에 대응된다고 볼 수 있고, 다중문자라고 봄이 합당하다. 한편 한국어 한글 규칙에서 ''은 'ㅇ'이 초성으로 들어가는 모든 글자에서 묵음이기 때문에 '아', '안', '알' 등을 모두 다중문자로 보기보다는 "''이 초성에서 묵음인 글자이다"라고 보는 것이 합당하다. 다소 규칙이 없는 묵음은 단어 단위로 묵음이라고 처리하는 것이 맞을 것이다. 예컨대 영어에서 'gn' 배열은 'reign'에서는 'g'가 묵음이지만 'regnum'에서는 그렇지 않은데, 이 때에는 'gn'이 다중문자라거나 'g'가 묵음이라고 처리하기보다는 "'reign'에서의 'g'는 묵음이다"라고 보는 것이 합리적이다.

아래 목록에는 묵음으로 볼 수 있는 예는 싣지 않았다.

4.4. 장음중복 자음

어떤 문자 연쇄에서는 장음이 되기도 하는데 이때는 '장음'이라는 것을 두 음의 연속이라고 본다면 다중문자가 아니지만, 그렇다고 음이 딱 2배가 되는 등 같은 음 2개와 정확히 같은 속성을 띠는 것은 아니기 때문에 약간 애매하다.

자음도 중첩되면 두 번 소리를 내는 것이 아니라 하나의 자음이 길어지는 중복 자음이 되는 때가 있다. 일각에서는 된소리, 거센소리도 중복 자음이라고 보는 견해도 있다.(최성원·전종호 1998)[10]

두 경우 모두 일반적인 음소 연쇄는 달리 장음/중복 자음일 경우에는 그 사이에 휴지(쉼)가 절대 들어갈 수 없다는 점이 다르다.

이 부류의 음을 나타내기 위해서 동일한 글자를 두 번 쓰는 문자 체계가 많다. 단, 대부분에게 익숙한 언어인 영어한국어는 모음의 장음화를 문자 중복으로 표기하지 않는다. 한글의 된소리를 중복 자음으로 본다면 자음에 대해서는 문자 중복으로 중복 자음을 나타낸다고 볼 수 있다.

5. 원인

5.1. 기능적인 한계

  • 글자 수의 부족
    라틴 문자는 워낙 많은 언어권에서 사용하고 있기 때문에 그 많은 언어권에서 라틴 문자의 기본 글자만으로 각 언어의 음소를 모두 표현하는 것은 불가능하다. 새로이 한 글자를 추가하지 않고서 이를 해결하기 위한 방책으로 글자 위에 부호(diacritic)를 쓰거나 여러 글자를 합쳐서 하나의 음소로 사용하는 식의 방편을 활용하는 것. 특히 모음은 라틴 문자에는 모음이 5개밖에 없기 때문에 대부분의 언어에서 부호 혹은 다중문자를 활용할 수밖에 없다. 이러한 문제는 라틴 문자 문화권이 아닌 곳에서 해당 언어를 라틴 문자로 전사할 때에도 발생한다.[11]
  • 부호를 컴퓨터로 입력하기 어려움
    오늘날에는 컴퓨터상으로 부호를 입력하기 어렵기 때문에[12] 본래 부호를 덧붙여 썼었던 것을 다중문자로 전환하는 경우도 있고, 이러한 표기법을 공식화하기도 한다. 예를 들어 'o'에 움라우트가 붙은 'ö'가 독일어에서 사용되는데, 움라우트를 적지 않을 경우 'oe'로 적기도 한다(Goethe-Göthe 등)[13]. 한국어에서도 매큔-라이샤워 표기법으로 'ㅓ, ㅡ'를 'ŏ, ŭ'(o, u with breve)로 적다가 국어의 로마자 표기법에서 다중문자인 'eo, eu'로 전환하였다. 이처럼 한국어 로마자 표기법에 부호와 다중문자 사이에 어느 것이 더 나을 것인가 하는 논의가 있다.
    에스페란토도 다중문자를 사용하지 않는 것이 원칙이지만, 곡절 부호가 붙은 다섯 글자(Ĉ, Ĝ, Ĥ, Ĵ, Ŝ)와 단음 부호가 붙은 한 글자(Ŭ)를 입력하기 어려운 때가 있어 cx, gx, hx, jx, sx, ux 식으로 에스페란토에 사용되지 않는 글자 X를 붙여서 적기도 한다.

5.2. 역사적 언어 변화

이 단락의 이유로 인한 다중문자는 표기 체계의 보수성과 밀접한 관련이 있다. 각자의 음소가 제각기 역사적 변화를 겪으면 표기가 보수적이더라도 각각의 음소를 나타내므로 다중문자가 되지 않지만 역사적 언어 변화에서는 이웃 음소에 의해서 함께 변화하는 일이 종종 벌어지기 때문에 다중문자를 일으키기 쉽다.
  • 음 탈락(묵음)
  • 음소 연쇄 제약의 변화
    본래는 빈번하게 함께 등장하는 음소 연쇄였으나 제약이 바뀌어 오늘날에는 그러한 연쇄가 불가능해진 경우 어느 한쪽은 묵음이 될 수밖에 없고 다중문자가 된다. 영어의 'kn'가 그러한 사례로 게르만어 계열에서는 [kn] 연쇄가 가능했었고 고대 영어 역시 그러하였으나 오늘날에는 불가능하여 [n]으로만 발음된다. 이때 철자가 보수적이면 다중문자가 된다.
  • 이중음의 단일음화
    본래는 두 세 글자로 쓰고 두 세 음으로 읽는 중복음이었으나 단일음으로 바뀌는 역사적 변화를 겪고, 표기가 이를 따라가지 않으면 다중문자가 된다. 특히 변화한 음이 기존에 없던 음소인 경우 새로운 표기를 창제하거나 표기 체계를 재정립하지 않는 한 표기가 음을 따라간다는 것이 구조적인 차원에서 불가능하다.
    한국어 한글 표기에서 본래 [aj~ai]로 읽던 'ㅐ'가 [ɛ]로 단일음화했지만 표기는 여전히 'ㅐ'로 남아 다중문자가 되었다.
    일본어 역사적 가나 표기법순음퇴화와 그에 따른 장음화가 반영되지 않은 보수적인 표기이므로 다중문자가 많다. けふ라고 쓰고 [kjoː]로 읽는 것이 그 예(けふ→けう→きょう). 오늘날에는 きょう라고 쓰므로 장음화를 중복 모음으로 생각한다면 다중문자가 아니다.
    • 본래 언어의 단일음화
      어떤 외래어에서 이중 음소로 나타나는 것을 곧이곧대로 전사해 두 개 이상의 글자로 나타냈는데 해당 외래어의 본래 언어에서 해당 이중 음소가 단일음이 되는 경우 다른 나라에서의 표기는 모조리 다중문자가 된다.
      앞서 소개한 러시아 문자 'щ'를 독일어 철자로 'schtsch'로 적는 것이 그 사례. 원래 러시아 문자 'щ' 역시 [ɕt͡ɕ] 였기 때문에 독일어에서 'sch' + 'tsch'의 [ʃt͡ʃ\]로 적는 것은 독일어에서 각각 삼중문자/사중문자의 사례이지, 칠중문자까지 갈 사례는 아니었다. 그런데 러시아어에서 'щ'가 이중 음소 [ɕt͡ɕ]에서 단일 음소 [ɕː]로 변화한 반면[14] 독일어의 철자는 변하지 않았기 때문에 러시아어 'щ[ɕː]'를 독일식으로 'schtsch'라고 보수성으로 유지한 상태에서 [ɕː]로 읽는다고 하면 칠중문자가 된다. 그래서 영문 위키백과 오중문자에는 몇 안 되는 예 중 2개가 'щ'의 라틴 문자 표기일 정도이다.# 이러한 보수적인 전사 표기는 동아시아 언어들에서 'щ'를 표기할 때에도 보수적인 발음을 따르도록 영향을 주었는데 Хрущёв를 '흐루시초프'로 적었던 것도 그 예이다. 발음의 개신이 이루어진 이후에 출생한 사람을 개신 이전의 음으로 적는 것은 의미가 없으므로 현재는 '흐루쇼프'로 교정되었다.

5.3. 외래어 표기 전사

다른 문자 체계를 글자 그대로 전사(轉寫, transcription)하는데 도착 언어의 문자 체계에서 1:1로 맞대응할 수 없는 경우, 새로운 글자를 추가하지 않고 두 개 이상의 문자 배열로 나타내면 다중문자가 된다. 이때 'y, z'와 같이 그리스 문자 'υ(웁실론), ζ(제타)'를 표기하기 위해서 새로운 글자를 추가하면[15] 하나의 문자이므로 다중문자가 되지 않는다.

이 이유의 다중문자에는 번역상의 원음주의가 큰 영향을 미친다. 자국에 없는 조합을 만들어야 할 정도라면 해당 언어에는 잘 쓰이지 않는 음일 가능성이 높은데, 전사 과정에서 원음의 손실을 원하지 않기 때문에 새로운 조합을 만들어내는 것이다. 그렇지 않고 자국 내에 있는 음소로만 나타내려고 할 경우 다중문자가 잘 발생하지 않는다.

하지만 적기는 그렇게 적는다고 해도 외국의 음소 구분이기 때문에 발음은 구별하지 않는(못하는) 경우가 많다. 예컨대 독일어에서도 라틴어에서의 철자를 받아들여 'th'라는 다중문자를 사용하지만 발음은 [t]로 't'와 구분하지 않는다. 그리스 문자 'χ'에서 온 'ch' 역시 마찬가지로 영어에서는 [k]로 일반 'c'와 발음상으로 차이가 없다.
  • 본래 언어에서의 음소 대립이 도착 언어에 존재하지 않는 경우
    다른 문자 체계의 단어를 그대로 전사하려는데 도착 문자에서 해당 표기 구분이 존재하지 않을 경우 사용되기도 한다. 그 예로 그리스 문자에서 'θ'와 'τ'는 고전 그리스어에서 유기/무기음의 대립을 나타냈는데, 이 문자를 라틴 문자로 전사하려고 했던 라틴어에서는 유기/무기음의 대립이 나타나지 않았다. 그렇다고 해서 't'로만 적기에는 'θ'와 'τ'를 구분하고 싶었기 때문에 'θ'를 'th'로 적게 되었다.[16] 오늘날에도 유기음 [t]를 [th]로 적고, 음성학으로도 유기음에는 [h]가 포함된 것으로 여겨지므로 합당한 표기이다.
  • 본래 언어에서의 음소 연쇄가 도착 언어에서 제약을 받는 경우
    외래어가 유입되면서 외래어의 본래 언어에서는 가능한 음소 연쇄였으나 도착 언어에서 불가능해진 경우 음소 연쇄 중 하나만이 선택되어 발음되기도 한다. 그런 경우 표기상으로는 본래 언어의 발음을 따라 두 글자 이상으로 적으면 도착 언어에서는 다중문자가 된다. 예컨대 그리스어에서 'Ψ'로 시작되는 단어가 그리스어에서는 [ps]로 음운 연쇄가 가능했으나 영어에서는 불가능하므로 [s]로만 발음된다. 그러나 표기는 'ps'로 적으므로 다중문자이다.

6. 단점

6.1. 발음의 자의성

음소 문자에서 문자를 이어서 쓰면 대개는 음소 연쇄를 지칭하는데 그렇지 않고 특정 문자 배열만 하나의 음소로 읽는 것은 자의적일 수밖에 없다.[17] 글자 수가 많아지면 많아질수록 그렇게 많은 글자를 하나의 음소로 읽는 것은 더욱 자의적이기 때문에 나타나기가 어렵다. 이런 다중문자들은 언어의 필요성에 따라 그때그때 고안되는 것이기에 특정한 법칙이 없고 처음 배우는 사람들은 그냥 외워야 한다. 이 때문에 사중문자~오중문자까지 나올 정도가 되면 diacritic을 쓰는 것이 보통이며 더러는 새로운 낱문자를 창조하기도 한다.

6.2. 음절 구분의 어려움

하나의 발음을 표기하기 위해 다수의 글자를 쓰다 보니 뒤 음절과 붙어 혼선을 유발하는 사례(특히 합성어에서)가 적잖게 등장한다. 멀리 갈 것 없이 국어의 로마자 표기법 문서에서 예시로 등장하는 Bangogae로 예를 들면, '반고개'인지 '방오개'인지 글자만 봐서는 알 길이 없다. 한국어뿐만 아니라 폴란드어에서도 이런 문제가 있어서, 폴란드의 사이클 선수인 다비트 고젝(Dawid Godziek)이 데이빗 갓지옉, 다위드 가지크 같은 식으로 불리는 수모를 겪고 있다.

쯔꾸옥응으 등에서는 음절별로 띄어쓰기를 하여, 일본어 헵번식 로마자 표기법한어병음에서는 음절 구분 지점에 '를 사용하여 이 문제를 해결하고 있다.

6.3. 두문자어 축약의 애매함

종종 두문자어를 만들어야 할 때가 있는데, 처음 음절이 다중문자인 경우 하릴없이 다중문자 중 하나만 떼어 놓을 수밖에 없어[18] 그 글자만 보고는 원래 문장을 연상하기가 어려워진다는 문제가 있다.

6.4. 글자 수 증가

당연하겠지만 한 음절에 할당되는 글자 수가 늘어나는데, 이게 여럿 중첩되면 글자 수의 압박이 상당히 심하다. 가령 '가'는 ㄱ과 ㅏ 모두 로마자로 표기할 때 다중문자를 쓰지 않아 'ga'로 두 글자로 끝나지만, '경'은 한 개의 단일 문자 + 두 개의 다중문자[19]가 쓰여 'gyeong'으로 여섯 글자나 된다. 그래서 경상북도(Gyeongsangbuk-do), 첨성대(Cheomseongdae) 같이 다중문자가 다수 중첩되는 단어는 가독성이 급락하는 문제가 있다. 그래서 자주 쓰는 음은 다중문자보다는 개별 문자를 쓰려는 경향이 있다.

7. 발음

가능성만 따지면 adbd라고 써놓고 전혀 상관없는 다른 음으로 읽는 것도 있을 수 있겠지만 언어의 사회성에 따라 그런 납득이 안 되는 표기는 받아들여지기 어렵기 때문에 대체로 비슷한 음을 가진 문자들을 합쳐서 적는다.

특히나 자음과 모음의 구별은 꽤 선명한 것이어서 자음끼리 합치면 자음이고 모음끼리 합치면 모음이지, 반대가 발생하는 일은 극히 드물다. 단 아일랜드어에서는 'bh/mh/dh/gh' 등의 부드러운소리(lenition)된 자음이 모음 사이에 들어가면 모음처럼 행동하기도 한다.

7.1. 언어별 차이

다중문자를 어떤 하나의 음으로 읽자는 약속은 언어 내적인 것이기 때문에 언어별로 어떤 문자 배열을 무슨 음으로 읽을지는 언어에 따라 달라질 수 있다. 예컨대 'eau' 배열은 프랑스어에서는 [o]로 읽지만 영어에서는 [ju](ea+u)로 읽는다.

또한 어떤 언어에서는 음소 연쇄인 것이 어떤 언어에서는 다중문자로 하나의 음소인 경우도 있을 수 있다. 'sch' 배열이 대표적인 예시로, 영어([sk]), 독일어([ʃ]), 네덜란드어([sx])[20]에서 각각 다르게 발음된다.

이 때문에 철자법에서 다중문자 - 음소간의 대응 관계는 매우 중요하며, 각 언어를 배울 때 diacritic과 함께 제일 먼저 배우게 된다.

8. 그 외 표음문자에서

다중문자는 표음문자에서의 개념으로, 한자와 같은 표의문자에서는 합자 자체는 많이 일어나지만 이를 다중문자라고 볼 수는 없다. 합자 결과 변화하는 것은 의미이지 음이 아니기 때문이다. 합자하여 음의 차이를 나타내는 경우가 있다면 그러한 한자 합자 역시 다중문자로 볼 가능성은 있다.

8.1. 한글

한글에서 합자를 어디까지 인정하느냐에 따라서 다중문자의 개수도 달라질 수 있다. 본 문서에서는 ㄱ+ㄱ → ㄲ, ㅏ+ㅣ→ ㅐ 식의 합침, 이른바 훈민정음에서 '합용'으로 정의되는 것은 합자가 아니라 다중문자에 속하는 것으로 보았다. ㅇ을 아래에 쓴 , 와 같은 ㅇ연서(連書)는 다중문자라기보다는 합자에 더 가깝다고 볼 수 있다.

현대 한국어의 한글에서 초성 ''은 묵음이므로 'ㅇ'이 들어간 모든 글자는 다중문자로 볼 수도 있다.

8.1.1. 자음

  • 각자병서 , , , ,
    이것들은 (일반적인 관점에서) ㄱ와 ㄱ를 두 번 발음한 중복자음이 아니라 아예 다른 소리인 된소리를 나타낸 것이다. 위에서 언급한 대로 된소리를 중복 자음으로 본다면 이들은 다중문자가 아니다.
  • 중복 종성?
    현대 한국어에서 중복 종성(겹받침)들은 비록 단독으로 올 때 받침 중 하나가 음성상으로 탈락하기는 하나 모음이 이어질 때에는 둘 다 발음되기 때문에 다중문자에 속하지 않는다. 한편 '흙'이라는 단어를 모음이 이어질 때도 '흙을[흐글]' 식으로 읽는 등 '' 탈락 현상이 근래 구어에서 나타나고 있는데, 이런 현상이 지속된다면 ''이라는 표기도 'ㄺ'으로 쓰고 ''으로만 읽는 다중문자의 사례로 볼 수 있다.

8.1.2. 모음

  • 중세 국어
    한글 모음에서는 글자 구성 요소끼리의 조합과 완성된 낱글자 사이의 조합이 다소 혼동될 수 있기 때문에 세종은 훈민정음의 모음을 창시할 때 두 글자의 조합은 단일음을 나타내지 않도록 한 것 같기도 하다.[21] 그러한 추측이 사실이든 아니든 실제로 훈민정음 창제 시기의 모음에는 다중문자가 없다.
  • 현대 국어
    현대 한국어에서 ''와 ''가 다중문자의 예이다. 한글 창제 당시에는 ㅏㅣ와 ㅓㅣ를 빠르게 읽는 이중모음으로 다중문자가 아니었으나 단모음화하여 개별 음소를 나타내게 되었다. ', ' 역시 마찬가지로 이중모음이었으나 단모음화되어 이 부류에 속했었는데, 현대 구어에서는 다시 이중모음화되려는 변화가 나타나고 있다.

모음은 선과 점을 이용한 단순한 모양을 하고 있기 때문에 모아쓰기 체계로서는 3개 이상을 합쳐서 쓰는 것부터가 어렵다. 현대 한국어로는', ' 두 개뿐. 라틴 문자도 3자 이상을 합치는 일은 그다지 많지 않기 때문에 어떻게 감당할 수 있는 정도이기는 하다. 옛한글에서 3개 이상을 합치는 때에는 대체로 외국어에서 3개 이상의 모음이 연쇄되는 것을 표기한 경우가 많다.

8.2. 가나

가나에서는 작은 문자(스테가나)를 써서 다른 음을 나타낸다. 예를 들어 ティ는 テ와 イ를 합친 것이지만 'テイ[tei]'라고 읽지 않고 [ti]라고 읽게 된다. 음절문자인 가나의 속성상 합친 음도 하나의 음절이라는 것이 특징이다. 주로 앞 글자는 자음을 나타내고 뒷 글자는 모음을 나타내기 때문에 음절문자로서의 가나를 자음과 모음이라는 음소로 해체한 것처럼 보이기도 한다. [k]로 시작하는 음절을 나타낸 か행은 か·き·く·け·こ로 다섯 글자가 모두 다르지만, [t͡s]로 시작하는 음절을 나타낸 ツァ·ツィ·ツ·ツェ·ツォ는 라는 요소를 공유하고 있기 때문이다. 이러한 자음으로서의 역할은 주로 う단의 글자들이 담당하지만, た행에서는 て가 그 역할을 수행하는 등 약간의 차이는 있다.

합자의 논의에서처럼 아래첨자를 합자의 영역으로 넣는다면 ティ는 합자되어 [ti]를 나타내는 것으로도 볼 수 있다.

모음 두 개가 모여 하나의 모음을 나타내는 것도 드물게 나타난다. え단 + い가 え 장음이 되는 것도 일종의 다중문자로 볼 수 있다. 한국어 한글 표기에서는 이러한 모음의 다중문자를 인정하지 않기 때문에 え단 い가 나타났을 때 '에이'로 적어야 할지 '에'로 적어야 할지 고생하는 부분. え단 + い가 え 장음이 되는 것은 다소 수의적인 데에 비해 お단 + う는 한자와 한자 사이라거나 등 단어 및 형태소 경계가 없을 경우에는 거의 대부분 장음이 되기 때문에 다중문자이다.

오키나와어를 가나로 적을 때에는 ヲゥ[u]와 같이 모음을 붙여 하나의 모음을 나타내는 색다른 양상이 나타난다.

역사적 가나 표기법순음퇴화와 그에 따른 장음화가 반영되지 않은 보수적인 표기이므로 다중문자가 많다. けふ라고 쓰고 [kjoː]로 읽는 것이 그 예(けふ→けう→きょう). 오늘날에는 きょう라고 쓰므로 장음화를 중복 모음으로 생각한다면 다중문자가 아니다.

스테가나의 다른 용법으로 내파음을 표기할 때 う단의 글자를 작게 쓰는 것이 드물게 관찰되지만(대만어 가나 표기법에서 アク에서 ク를 작게 쓰는 등) 일단 이때 [ku]를 [k] 용으로 썼을 뿐이므로 다중문자에 속하지는 않는다.

8.3. 국제음성기호

국제음성기호(IPA)에서는 기본으로 하나의 음은 하나의 문자로 적게 되어 있어서 다중문자를 배제한다.

단, 파찰음 계열에 대해서 파열음 + 마찰음을 연이어 적은 뒤 합자라는 의미로 위 혹은 아래에 이음선(tie bar)을 적는다(t​͡s / t͜s). 글자 위에 있는 부호와 혼동되지 않기 위해 아래쪽이 더 선호되는 듯하다. 이 역시 파열음과 마찰음이 연달아 소리나는 것이 아니므로 일종의 다중문자이나, 이음선의 존재를 합자로 간주한다면 다중문자가 아니다. 아예 'ʦ'와 같이 문자 코드상으로도 합자해서 적기도 하나 표준 기호는 아니다.[22] 잘 쓰이지 않지만 ts로 첨자로 쓸 수도 있다. 실제로 폴란드어 같은 언어에서는 파열음 + 마찰음 연쇄와 파찰음이 음소 대립을 보이므로 다중문자는 피해야 할 필요가 있지만, 이음선과 같은 부호가 대체로 그렇듯 입력이 번거롭다거나 인쇄가 잘 되지 않는다는 이유로 생략되기도 한다.

9. 목록

자세한 것은 라틴 문자 이중문자 목록, 삼중문자 목록, 사중문자 목록, 오중문자 목록을 참조. 육중문자부터는 영어 위키백과에도 따로 페이지가 없다.

다중문자 가운데 많은 부분이 라틴어에서의 다중문자에서 영향을 받았다. 특히 그리스어에서 출발한 것들은 대부분 그리스어→라틴어→개별 언어 식.

9.1. 로마자

파일:상세 내용 아이콘.svg   자세한 내용은 다중문자/라틴 문자 목록 문서
번 문단을
부분을
참고하십시오.

9.2. 키릴 문자

9.2.1. 러시아어

러시아어는 다중 문자가 나타내는 변화된 음이 단일 문자로도 표기 가능하다는 것이 특징이며, 이는 폴란드어, 체코어, 우크라이나어 등 슬라브 언어 전반에 나타나는 공통점이다.
  • зж, сж - ж [ʐ]
  • зш, сш - ш [ʂ]
  • зч, сч, жч, зщ, сщ, жщ - щ [ɕː]
  • дч, тч - ч [t͡ɕ]
  • дс, тс - ц [t͡s]
  • чш - тш [tʂ][23]
  • дж - [dʐ]: 영어의 j·ge·dge를 비롯하여 외래어의 /d͡ʒ/ 음소를 표기하기 위해 쓰는 다중문자.

9.3. 그리스 문자

9.3.1. 그리스어

현대 그리스어는 코이네 시절부터 이어진 모음의 폭풍 단순화를 거쳐서 이중모음이었던 것이 단모음으로 변화한 사례가 많은데 표기는 바뀌지 않아 이중문자가 되었다.

그리스 문자는 라틴 문자의 원형이지만, 그리스어에서는 후대에 문자의 발음이 바뀌는데 라틴 문자에서는 안 바뀌는 경우가 몇 있었다.(β, γ, δ) 라틴 문자로 표기된 외래어를 전사할 때 그에 해당하는 그리스 문자를 대응시키려니 발음에 괴리가 생겨서 새로운 이중문자를 만들어 거기에 대응시킨다.

[1] 그래서 베트남 전쟁 당시 Nha Trang(냐짱)을 미국인들은 '나트랑'이라고 불렀다.[2] pentagraph는 '니체(Nietzsche)'의 철자가 워낙 특이한 경우여서 문서 내에서 오중문자라고 언급된다.[3] 언어학 담론에서 표기는 언중들의 언어 사용 관습 혹은 정서법과 같은 규정적 문제로 여겨진다. 전자는 언어문화, 후자는 언어교육, 언어정책적인 차원에서 다루어지고 근본적인 논의로는 보지 않는다. 때문에 언어학에서는 "이는 (언어 내적인 원리에 따른 것이 아니고) 단지 표기의 문제일 뿐이다 "라는 말을 자주 들을 수 있다.[4] 예: "이 문장에서 'a'라는 한 문자로 얼마나 많은 논쟁이 일었는지 모른다."[5] 예: "한글과 한자라는 두 문자를 사용하는 이 곳에서는..."[6] 언어학 분야에서 이와 비슷하게 중의성이 발생하는 예로 '-()'를 들 수 있다. '단어'(word)를 가리키는 것(예: '주어')와 '언어'(language)를 가리키는 것(예: '일본어')가 동시에 나타난다. 중국어로는 전자의 의미로 '-'()를 써서 중의성을 회피하고 있다.[7] 언어학적 개념으로는 장음이 아니지만 영어학에서 흔히 장모음이라고 불리는 쌍을 뜻한다. 가령 [a\]의 음운론적 장음은 [a:\]이지만 영어에서는 흔히 [eɪ\]를 'a'의 장모음으로 간주한다. 대모음추이 이전에는 실제로 장모음이었던 것의 흔적이다.[8] 이때의 e를 묵음 e(silent e)라고 한다.[9] 모두 오늘날 외국어 표기에는 쓰이지 않는 것이지만 문헌에 등장했기 때문에 용례를 인정받아 유니코드 조합형 옛한글로 입력할 수 있다. 한편 지금 시점에서는
연쇄를 위해
초성 'ㅂㄹ' 표기를 제안한다고 해도 이를 옛한글로 입력하는 것은 불가능하다. 각각의 초성/중성/종성은 현대 이전의 용례를 통해서 각각 따로따로 등재해야 하기 때문이다.
[10] 최성원·전종호(1998), 한국어 경음 · 기음은 중복자음인가?[11] 일본어는 모음이 딱 5개이기 때문에 다중문자를 사용하지 않고서도 'a, e, i, o, u' 다섯 모음으로 모든 모음을 다 표기할 수 있다. 로마자 문화권이 아닌 일본어에서 로마자 표기법이 그다지 별 혼동 없이 사용되는 이유이기도 하다. 한편 베트남어는 자국 내의 어문 생활에서 로마자를 본격으로 사용하고 있지만 모음의 수가 다양하고 성조가 존재해 부호를 많이 사용한다.[12] 그래도 오늘날 휴대전화 입력기에서는 라틴 문자 키를 꾹 눌러서 diacritic 붙은 문자를 입력할 수 있게 되어 입력 편의성이 개선되었다.[13] 다만 괴테는 Göthe로 적지 않고 Goethe로 적는 게 독일에서도 정식 표기법인데, 이는 고유 명사이기 때문이다. Erich Raeder 또한 그 예시.[14] 우크라이나어에서는 현재에도 'щ'를 [ɕt͡ɕ\]로 발음한다.[15] 한편 'X'는 다소 애매하여 그리스 문자 'ξ(크시)'와는 직접적인 연관이 없으며 에트루리아 알파벳에도 이미 'x'는 글자로 포함되어 있었다.[16] 그런데 나중에 그리스어에서 'θ'의 발음이 [th\]에서 마찰음 [θ\]로 바뀌어버렸기 때문에 끝내 'th'와 θ는 별 관련이 없어졌다.[17] 그래도 완전히 관련이 없지는 않게 일부 자질들이 반영되기도 한다.[18] Ph. D. 처럼 다중문자를 한 덩어리로 남기는 경우도 간혹 있긴 하다.[19] 학자에 따라서는 gy를 '경구개화 연구개 파열음'을 나타내는 다중문자로 취급하여 세 개의 다중문자라고 보기도 한다.[20] 단 네덜란드어에서는 사실 s+ch의 조합이다.[21] 반대로 한 글자로 두 개 이상의 음의 연속을 대응시킨 것은 있다. 'ㅑㅕㅛㅠ'와 같은 [j\] 상향이중모음들은 한 글자로 두 음이 대응된다. 이는 [j\] 상향이중모음의 일부에만 주어지는 특혜로, 중앙어 기준으로 등장 빈도가 낮았던 는 두 글자로 표현했다. 조선 후기에는 이 둘에 대해서도 ㅑㅕㅛㅠ와 같은 방식으로 ᆖ와 ᆢ를 만들었다.[22] 자주 쓰이는 파찰음 6개에 대해서만 합자된 자형이 유니코드에 실려있다(ʣ, ʤ, ʥ, ʦ, ʧ, ʨ).[23] 사실 이상의 다중문자들은 "일부러 해당 발음을 표기하기 위해 사용한 여러 문자의 나열"이 아니라 단순히 발음의 편의를 위한 음운 변동에 더 가까우므로 다중문자의 예시로 보기엔 부적합한 편이다.[A] 현대 그리스어[B] 고전 그리스어[A] [A] [C] 모음/유성음 앞에서만[29] 일부 단어에서[A] [D] 어두 및 차용어에서[E] 어중 및 어말에서[B] [A] [B] [A] [B] [A] [A] [C] [B] [A] [A] [C] [A] [D] [A] [E] [A] [D] [A] [E] [A] [B] [A] [56] 순수 그리스어에는 없는 /tʃ/ 발음의 전사에도 사용하지만 여기서도 발음은 /ts/로 한다. 예를 들면 Τσε Γκεβάρα.[B] [A] [B] [A]