최근 수정 시각 : 2024-11-03 22:19:08

한어병음

汉语拼音에서 넘어옴
중국어의 공식 로마자 표기법
{{{#!wiki style="margin: -5px -11px; padding: 5px 0px;"
{{{#FFF {{{#!folding [ 펼치기 · 접기 ]
{{{#!wiki style="margin: -5px 0px;"
중화민국 중화인민공화국
국어라마자 한어병음
1928년~1949년 1949년~1958년 1958년~1986년 1986년~2002년 2002년~2008년 2009년~현재
국어라마자 국어 주음부호 제2식 통용병음 한어병음
중화민국 대만 }}}}}}}}}}}}

언어별 로마자 표기법 목록
{{{#!wiki style="margin: 0 -10px -5px; min-height: 26px"
{{{#!folding [ 펼치기 · 접기 ]
{{{#!wiki style="margin: -6px -1px -11px"
<colbgcolor=#1e90ff> 한국어 프랑스식 - 한글학회식 - 예일식 - 48년 문교부식 - 59년 문교부식 - M.R. 식 - 파일:대한민국 국기.svg 00년 문광부식 - 김복문식 - 국립국어원식
한세식 - 유만근식 - 양병선식 - 홍승목식 - 86년 북한식 - 파일:북한 국기.svg 97년 북한식 - ISO/TR 11941
일본어 JSL - 훈령식 - 일본식 - 파일:일본 국기.svg 헵번식 - 포르투갈식
표준중국어 우정식 - W.G.식 - 화어통용병음 - 국어라마자 - 주음부호 2식 - 예일식 - 파일:중국 국기.svg 파일:대만 국기.svg 한어병음
광동어 월어병음 - 광동어 예일식 표기법 - 광주화병음 - 파일:홍콩 특별행정구기.svg 홍콩 정부식 - 파일:마카오 특별행정구기.svg 마카오 정부식
민어 민남어백화자 - 파일:대만 국기.svg 대라병음 - 대어통용병음 - 조주화병음 - 해남병음
객가어 객가어백화자 - 파일:대만 국기.svg 객가어병음 - 객어통용병음 - 객가화병음
아랍어 BGN/PCGN - UNGEGN - 미국 의회도서관식 - 이슬람 백과사전식
페르시아어 미국 의회도서관식 - 이슬람 백과사전식 - 파일:이란 국기.svg UN식
아르메니아어 파일:아르메니아 국기.svg BGN/PCGN - 미국 의회도서관식 - ISO 9985
조지아어 파일:조지아 국기.svg 조지아 정부식 - BGN/PCGN - 미국 의회도서관식 - ISO 9984
그리스어 파일:그리스 국기.svg ELOT 743 - 미국 의회도서관식
히브리어 파일:이스라엘 국기.svg 이스라엘 정부식 - ISO 259
힌디어 IAST - 파일:인도 국기.svg 헌터식
티베트어 와일리 표기법 - 장어병음
타이어 ISO 11940 - 파일:태국 국기.svg 왕립학회식
벨라루스어 BGN/PCGN - 파일:벨라루스 국기.svg 벨라루스 정부식 - 라친카 - ISO 9
불가리아어 파일:불가리아 국기.svg 불가리아 정부식 - ISO/R 9
러시아어 BGN/PCGN - 파일:러시아 국기.svg GOST 7.79-2000 - ISO 9
우크라이나어 BGN/PCGN - 파일:우크라이나 국기.svg 우크라이나 정부식 - ISO/LN 9 }}}}}}}}}
중국어 한국어
간체자
汉语拼音方案
한어병음방안
정체자
漢語拼音方案
한어병음 Hànyǔ Pīnyīn Fāng’àn
  • 복사용
    • 일반
      • ā á ǎ à · ē é ě è · ī í ǐ ì · ō ó ǒ ò · ū ú ǔ ù · ü ǖ ǘ ǚ ǜ
      • Ā Á Ǎ À · Ē É Ě È · Ī Í Ǐ Ì · Ō Ó Ǒ Ò · Ū Ú Ǔ Ù · Ü Ǖ Ǘ Ǚ Ǜ
      • [1] ' [2]
    • 특수
      • ê ê̄ ế ê̌ ề · m̄ ḿ m̌ m̀ · n̄ ń ň ǹ / ĉ · ŋ ŋ̄ ŋ́ ŋ̌ ŋ̀ · ŝ · ẑ
      • Ê Ê̄ Ế Ê̌ Ề · M̄ Ḿ M̌ M̀ · N̄ Ń Ň Ǹ / Ĉ · Ŋ Ŋ̄ Ŋ́ Ŋ̌ Ŋ̀ · Ŝ · Ẑ
      • · [3]


1. 개요2. 역사3. 사용 현황
3.1. 중화인민공화국3.2. 중화민국(대만)3.3. 싱가포르
4. 표기 원칙
4.1. 성모(聲母)4.2. 운모(韻母)
4.2.1. 간단한 요약4.2.2. 상세한 설명4.2.3. 공운(영운모), 얼화 운미, 어깻점(격음 부호)4.2.4. 감탄사·의성어·의태어 등 특수한 운모
4.3. 성조(聲調)
4.3.1. 성조 부호를 찍는 모음자
4.3.1.1. 간단한 요약4.3.1.2. 상세한 설명
4.4. 띄어쓰기, 하이픈, 대문자 처리
5. 한어병음자모와 한어병음방안의 차이6. 참고
6.1. A, G의 소문자(와 2성 부호(´)의 자형)에 대해
7. 대체 기호
7.1. 중국 여권의 표기 방식
8. 유니코드9. 미국 의회도서관10. 성조 번호 → 성조 부호 변환 도구
10.1. 이미 입력되어 있는 Zhong1wen2을 Zhōngwén으로 변환해 주는 온라인 도구10.2. 운모와 성조 번호를 직접 입력하면 성조 부호를 붙여 주는 도구
10.2.1. 온라인 도구10.2.2. 오프라인 도구
11. 한자 → 한어병음 변환 도구12. Chinese Pinyin 글꼴 (위장술, 편법)
12.1. Chinese Pinyin 변환표
13. 둘러보기

1. 개요

Nàmù wéijī, dàjiā gòngtóng péiyù de zhīshi zhī shù.
정체자:
納木維基,大家共同培育的知識之樹。

간체자:
纳木维基,大家共同培育的知识之树。

나무위키, 여러분이 가꾸어 나가는 지식의 나무.
Rén rén shēng ér zìyóu, zài zūn yán hé quán lì shàng yí lǜ píngděng. Tāmen fùyǒu lǐ xìng hé liáng xīn, bìng yīng yǐ xiōngdì guānxi de jīngshén xiāngduì dài.
정체자:
人人生而自由,在尊嚴和權利上一律平等。他們賦有理性和良心,並應以兄弟關係的精神相對待。

간체자:
人人生而自由,在尊严和权利上一律平等。他们赋有理性和良心,并应以兄弟关系的精神相对待。

모든 인간은 태어날 때부터 자유로우며 그 존엄과 권리에 있어 동등하다. 인간은 천부적으로 이성과 양심을 부여받았으며 서로 형제애의 정신으로 행동하여야 한다.
- 세계인권선언 제1조의 표준 중국어 번역

한어병음방안은 1958년에 중화인민공화국에서 제정된 중국어 로마자 표기법이다. 중국어 표기법을 로마자로 만들어야된다는 주장 자체는 19세기 후반부터 일어서 이미 여러 표기법이 있었지만, 혼란속에 따로 표준화되지 않고 중구난방이던 상황이었는데, 중국의 언어학자 저우유광(周有光, 1906~2017)[4] 등이 고안했다. 원칙적으로 한어병음이나 여기서 파생된 한어병음 정사법 기본 규칙표준 중국어 발음만 다룬다. 한어병음을 변형하여 노국음이나 경극의 대사 등 보수적 관화 발음 체계를 아우른 중국어 방언, 또는 중화권내 소수민족 언어 발음 등에도 대응시키기도 하나 이는 한어병음을 확장·변형한 것이지 한어병음 그 자체는 아니다.

현재 중화인민공화국과 중화민국(대만)의 공식 중국어 로마자 표기법으로, 1982년에 국제표준화기구(ISO)에 표준중국어의 표준 로마자 표기법으로 등록되었다(ISO 7098). 싱가포르에서도 사용하지만 지명 표기에 잘 안 쓴다. 이유는 아래 참고.

한어병음방안은 발음 기호로 고안되었지만 주음부호와 더불어 중국어를 표음 표기하는 체계로 기능하기도 한다. 중국에서는 일반적으로 컴퓨터에서 한어병음으로 한자 입력을 하며(그 외 방법은 중국어/입력기 참조), 보통 중국어(표준중국어)를 배울 때에는 한어병음으로 발음 및 한자 독음을 배우게 된다.

2. 역사

중국이 근대화를 시작한 이후, 한자는 근대화를 방해하게 만든 원흉, 전근대성의 상징으로 여겨져 청나라 말기 때부터 일부 지식인들 사이에서 배척되었다. 신문화운동 당시 루쉰과 같은 일부 지식층을 중심으로 한자를 구시대의 유물로 여기는 시각이 대두되어, 한자를 폐지하자는 문자개혁운동이 일어났었다.

여기서 한자의 대안으로 대두되었던 것 중 하나가 중국어를 로마자로 표기하는 것이다. 중국어를 로마자로 표기하자는 방안 자체는 19세기 후반부터 있어왔고, 중국어 라틴화도 이때부터 논의되었지만, 수많은 논쟁끝에 1918년에 중앙정부에서는 주음부호를 중국어의 공식 표기법으로 공인했었다. 그러나 주음부호는 기존의 한자를 표기하던 관성과 중국 전역이 혼란에 빠진 영향으로 인해서 제대로 정착되지 못했다. 1930년대 소련은 자국에 있는 한족계 소련인을 위해 소련 내 한족 언어학자를 초빙해 중국어를 로마자로 표기하는 방안을 고안했는데 이를 라틴화신문자(拉丁化新文字)라 한다. 소련은 이것을 공산주의를 배우러 온 중국공산당 간부들에게도 가르쳐주었다. 중국 공산당 지도부도 한때 중국어의 로마자화를 긍정적으로 여겨 이 체계에 기반한 여러 출판물을 내놓기도 했다.

그러나 라틴화신문자는 중국어를 표기하는 체계로 채택되지는 못했는데, 다음과 같은 원인이 있다.
  • 얼마 못 가 중국 공산당과 소련의 관계가 나빠졌다. 그런 상황에서 소련이 만들어준 체계를 쓸 수는 없었다.
  • 한자로 적힌 방대한 문헌을 가진 중국에서 한자를 완전히 배제하는 것이 말처럼 쉽지 않았다.
  • 중국어 각 방언들은 말이 방언이지 실제로 외국어 수준으로 의사소통이 안 되는 경우가 많았다. 라틴화신문자는 엄밀히는 중국어 방언의 일종인 관화를 로마자로 표기한 것인데, 다른 방언을 쓰는 사람 입장에서는 관화를 한자로 표기하면 한자를 통해 내용을 알 수 있는 반면, 표음문자인 로마자로 표기하면 외국어나 다름없게 되므로 지역간 교류나 의사소통에 지장을 준다.
  • 당시 중국 공산당은 중국국민당의 탄압을 피해 중국 대륙 이곳저곳을 떠도는 신세였으니 이런 문자체계를 보급할 여력이 없었다.

1949년에 중국 공산당이 중국 대륙 전역을 장악했다. 이때 마오쩌둥은 중국어를 로마자화하는 것을 다시 고려했으나, 위와 같은 이유로 로마자화를 포기했다. 여기에는 중국어는 한자로 표기하는 게 낫다고 생각한 스탈린의 설득도 영향을 미쳤다고 한다. 그렇지만 마오쩌둥은 표준 중국어 보급과 문맹 퇴치를 위해서라도 한자의 발음을 표기할 체계가 필요함을 인정하여, 중국어 발음 표기 체계 개발을 시작한다. 이에 따라 저우언라이 국무원 총리는 저우유광을 비롯한 여러 언어학자를 초빙하였고, 이들은 주음부호의 성조 표기와 라틴화신문자, 국어라마자, 웨이드-자일스 표기법 등을 참조하고 그 문제점을 개선하여 한어병음을 개발했다.

3. 사용 현황

3.1. 중화인민공화국

중국 고유 명사를 영어권에서 표기할 때는 기본적으로는 한어병음방안을 바탕으로 한다고 생각하면 된다. 성조 부호는 생략되는 것이 일반적이다. 로마자를 쓰는 다른 언어권에서도 비슷하다.

그러나 중국 내 소수 민족 언어를 한자로 음차한 경우라면, 외국어에서 지명을 표기할 때 음차한 표준중국어 발음의 한어병음 표기가 아니라 해당 언어의 발음을 기초로 표기한다. 물론 음차했다는 인식이 강한 경우에만 그렇다. 가령 중국 신장 위구르 자치구의 수도 위륌치(乌鲁木齐/烏魯木齊, 우루무치)는 Wulumuqi가 아니라 Ürümqi이다. 다른 예로, 내몽골 자치구에 있는 지명들도 몽골어를 기준으로 표기하는 사례가 흔하다. 가령 오르도스(鄂尔多斯/鄂爾多斯, 어얼둬쓰)는 E'erduosi가 아니라 몽골어식인 Ordos를 쓴다. 반면 소수민족 언어를 음차했지만 그런 인식이 별로 들지 않는다면 영어로도 그냥 음차한 표준중국어 표기를 따른다. 가령 헤이룽장성 자무쓰(佳木斯)는 만주어식인 Giyamusi가 아니라 표준중국어 발음의 한어병음 표기(성조 부호 생략)인 Jiamusi를 사용한다.

물론 고유 명사들을 영어 등 외국어로 옮길 때가 아니라 그냥 표준중국어 발음을 옮겨 발음 기호로서 쓸 때는 당연히 한어병음을 그대로 쓴다. 이건 중국어에서만 그런 게 아니고, 다른 언어에서도 로마자 표기법을 발음 기호로 사용하는 경우라면 그 언어의 (사실상) 표준 로마자 표기법으로 쓴다. 만약 한글을 모르는 사람에게 한국어의 발음 기호로 로마자 표기법을 사용한다면, 박정희는 본인이 사용했던 표기 Park Chung-hee로 적는 게 아니라 Bak Jeonghui(매큔-라이샤워 표기법이라면 Pak Chŏnghŭi)로 적어야 한다.

중국어 단어를 병음으로 표기한 후 그 두문자를 채택하여 쓰기도 하는데, HSK가 좋은 예이다. 이 약자를 읽는 방법은 크게 세 가지 유형이 있다. 하나는 축약하기 전 원형의 발음, 다른 하나는 각 로마자의 영어식 발음, 나머지 하나는 각 로마자의 병음식 발음이다(이게 가장 드물게 쓰인다). 이 세 가지 방법으로 HSK를 읽으면 각각 Hànyǔ Shuǐpíng Kǎoshì(汉语水平考试), [eɪtʃ.ɛs.keɪ](청해 시험 듣기 파일을 들어 보면 내레이터들은 이 발음으로 읽는다), ha-ês-kê가 된다. 다만 열차 번호에서는 원형대로 읽는다고 규정되어 있다. 가령 K388에서 K는 快의 병음 표기의 앞 글자이다. 그래서 여기서는 원래대로 kuài sānbǎi bāshíbā로 읽는 것이다.

참고로 영어권에서 표기할 때 성조 부호가 생략되다 보니 대륙의 陝西(Shǎnxī)성과 山西(Shānxī)성이 둘 다 Shanxi로 적히는 문제가 발생하는데, 이 둘을 구분하기 위해 陕西/陝西(Shǎnxī)성은 영어에서 Shaanxi로 표기하고, 山西(Shānxī)는 그냥 Shanxi로 표기한다. 다만 그래도 陝西의 성조를 생략한 한어병음 표기가 Shaanxi가 절대 안 된다. 성조를 생략한 한어병음 표기는 어디까지나 Shanxi이다. Shaanxi는 첫 음절을 한어병음이 아닌 국어라마자 표기법이라는 다른 로마자 표기법으로 적은 예외 표기이다. 자세한 사항은 산시성 문서의 설명을 참고할 것. 물론 이 두 지명도 외국어로 표기할 때 말고 중국어의 '발음 기호'로서 쓸 때는 Shǎnxī와 Shānxī로 쓴다.

3.2. 중화민국(대만)

대만에서는 사정이 좀 다른데, 그 이전에도 국어 주음부호 2식 등 여러 가지 대만식 로마자 방안이 있었다. 그러나 대만인들이 가장 널리 사용한 건 웨이드-자일스 표기법이었다. 이후 2002년에 대만에서 자기 나름대로의 로마자 방안을 고안한 '통용병음'이 채택되었지만, 대만인들은 학교에서 한자를 배우거나 키보드 입력을 할 때 주음부호를 사용하므로 어느 쪽 병음이건 쓸 일이 그다지 없고, 또 외국인들은 당연히 중국어 학습에서 한어병음을 사용할 것이므로 사실상 거의 쓸모가 없다는 말이 나왔고, 결국 2009년 1월 1일을 기해 통용병음은 더 이상 공식 표기법이 아니게 되었다.

현재는 대만에서도 중앙정부 차원에서 공식 로마자 표기법으로 한어병음방안을 받아들였다. 성모나 운모 표기에 어떤 글자를 사용할지는 그대로 따라가지만 대문자 처리법이나 기타 띄어쓰기 등의 차이는 있다. 근거 규정은 중화민국 교육부 중국어 소리옮김 사용 원칙(
中文譯音使用原則
, 2011년 최종 개정)에 나와 있는 '우리 나라의 중국어 소리옮김은 다른 규정이 있는 경우를 제외하고는 한어병음을 기준으로 한다(
我國中文譯音除另有規定外,以漢語拼音為準
).'이다. 그러나 타이베이시 같은 대도시에서는 표지판의 영문 표기가 한어병음방안을 바탕으로 하고 있어서 잘 지켜지는 편인데, 다른 지역에 가 보면 현재도 웨이드식, 통용병음 등 다른 표기를 따라간 영문 표기도 여럿 발견된다.

또한 유명한 도시들의 영문 표기는 전통적으로 써 온 철자(웨이드식 같은 다른 로마자 표기법의 영향을 받거나 관습에 의한 것)대로 쓴다[5]. 병음 표기와 영문 표기가 일치하게끔 베이징까지 영어 철자를 바꾼 대륙과는 대조되는 것.[6] 지룽(基隆)은 Jilong이 아닌 Keelung, 가오슝(高雄)은 Gaoxiong이 아닌 웨이드-자일스 표기법 기반인 Kao(-)hsiung, 신(新竹)는 Hsinchu(한어병음 Xinzhu)지만 그 옆에 있는 베이(竹北)는 Zhubei이다. 신주는 나름대로 유명한 도시라서 전부터 쓰던 대로 썼지만, 주베이는 그리 잘 알려지지 않은 곳이라 그냥 한어병음방안대로 표기했다.

대만에서도 방언 발음이나 소수민족 언어를 한자로 음차했다면, 외국어에서 지명을 표기할 때 음차한 표준중국어 발음의 한어병음 표기가 아니라 그 언어의 발음을 기초로 표기한다. 예를 들면 단수이는 Danshui가 아니라 민남어 발음인 Tamsui이고, 화롄현의 타로코(타이루거)는 Tailuge가 아니라 원주민 언어를 대만어로 음차한 Taroko이다.[7] 원래는 이것도 다 한어병음으로 바꾸려 했는데, 각 지역에서 반발이 심해 그냥 놔둔 것이다.

이렇게 한어병음을 공식적으로 채택했음에도 불구하고 옛 표기법들이 사라지지 않는 이유로는 한어병음이 대륙 중국에서 제정된 표기법이기 때문에 이에 대해 안 좋은 감정을 가진 사람들이 많은 것도 있다. 그리 큰 나라가 아닌데도 표기가 여태 중구난방인 데에는 이런 사정이 있었던 것. 대만에서는 중앙정부가 아닌 지방정부 소유 시설에 대해서는 로마자 표기 결정도 지방정부의 권한이라 민주진보당의 세력이 강한 대만 남부로 갈수록 지자체에서 한어병음을 거부하고 통용병음을 쓰는 경향이 강하다. 아예 가오슝 첩운 역들은 전부 통용병음이며 앞으로 계획된 역들의 이름도 모두 통용병음으로 정해져 있고, 타이난에선 도로 표지판 상당수가 통용병음을 사용한다.


좡루이슝(莊瑞雄)이라는 민진당 의원이 "나는 몇십 년 동안 전부 Syong이라고 적어 왔다"라며 대만 인명 및 지명에 한어병음을 쓰는 것에 적극 반대했는데, 통용병음은 1998년에 처음 소개되었으며, 대만 사람들은 대부분 습관적으로 웨이드-자일스 표기법을 따르므로 문제가 있는 주장이다. 실제로는 웨이드-자일스 표기법대로 Hsiung으로 적었을 가능성이 상당히 높다. 물론 해당 의원이 자기 이름을 나름대로 Syong[8]으로 쓰던 것이 우연히 통용병음과 일치했을 가능성도 있으므로 확답할 수는 없지만. 타이베이의 버스 터미널 표지판에 A4 용지로 인쇄한 통용병음을 붙이는 시위를 했다. 전체 영상은 여기를 참조.


타이베이 첩운신베이 시 루저우(蘆洲) 구까지 연장되어서 루저우역의 역명판을 한어병음으로 적었을 때에도 쓰촨성의 루저우(瀘州)와 헷갈린다며 반대했다. 영상 초반에 보면 민진당 의원이 또 A4 용지로 된 통용병음을 붙이는 소동을 벌였다.


저스트 댄스 2015에 수록된 채의림의 "Dancing Diva". 가사가 한어병음으로 나온다. Just Dance Wiki에서는 중국어 제목(舞娘)을 한어병음으로 적어서 "Wu Niang"으로 나온다. 가수 이름(Jolin Tsai)을 제외하면 거의 다 한어병음 표기로 나온다.

저스트 댄스에서는 모든 대만 노래 가사에 한어병음 표기가 나온다.

2020년대에는 대만의 젊은 세대들에게도 한어병음이 익숙한데, 사회관계망 서비스나 각종 채팅 앱에서 자기 아이디를 자기 이름의 한어병음 표기에서 따오는 사례를 많이 볼 수 있다. 대만의 한 체조 선수는 자기 이름의 영문 표기 자체는 웨이드-자일스 표기법을 바탕으로 하나 인스타그램 아이디는 자기 이름의 한어병음 표기로 만들었다. 그 밖에도 유사 사례를 자주 발견할 수 있다. 즉 대만의 젊은 세대는 한어병음을 애용하지는 않을지언정 그 체계에 대한 지식을 가진 사람이 많다는 의미일 것이다.

하지만 여전히 한어병음이 낯선 대만인이 대부분이며, 사회관계망 서비스나 각종 채팅 앱에서 사용하는 아이디를 한어병음 표기에서 따오는 것은 웨이드-자일스 표기법에서 j 발음을 ch , q 발음을 chʻ , x 발음을 hs , r 발음을 j 으로 표기하는 등 웨이드-자일스 표기법에 익숙하지 않은 사람에게 직관적이지 못하기 때문인 것이고,[9] 한자나 주음부호가 아닌 방법으로 자신의 이름을 표기해야 할 때에는 대부분이 웨이드-자일스 표기법으로 표기한다.

한어병음의 경우 로마자 표기와 비슷하여 한어병음을 모르는 사람도 어느정도는 읽을 수 있을 정도이기 때문에 정체자가 아닌 간체자에도 익숙한 대만 젊은세대들이 한어병음을 사용하는 데에 어렵지 않을 것 처럼 생각되지만, 의외로 대만인들의 대부분이 한어병음을 거의 읽지 못하고, 한어병음 키보드 또한 전혀 사용할 줄 모른다. 일상에서 국어 발음을 표기할 때에도 주음부호를 모르는 외국인들이 많이 접근하는 곳을 제외하면 한어병음을 사용하는 경우는 거의 없으며, 주음부호만을 사용하고 있다. 결국 공식 로마자 표기법으로 한어병음방안을 선택했지만 현재 실권은 거의 없는 편이다.

3.3. 싱가포르

싱가포르에서도 표준중국어 발음 표기에 공식적으로 한어병음 방안을 사용한다. 그러나 싱가포르 내의 영어/말레이어 표기 지명은 한어병음을 바탕으로 표기하는 곳이 별로 없다. 영어나 말레이어를 음차하거나 번역한 지명도 많고, 표준중국어가 아닌 방언 발음을 바탕으로 표기하는 곳이 많기 때문이다.

가령 싱가포르의 女皇鎮의 영어 표기는 Nühuangzhen이 아니라 원래 어원인 Queenstown으로 쓴다. 그리고 중국어 방언을 뿌리로 하는 싱가포르 지명은 영어/말레이어 표기 때 음절별로 띄어쓰기를 한다. 표준중국어를 바탕으로 하는 지명은 중국 대륙처럼 붙여 쓴다. 예로 義順은 방언 발음으로 표기할 때는 Nee Soon, 표준중국어 발음으로 표기할 때는 Yishun이다.

4. 표기 원칙

한어병음방안의 음소 표기의 일반 원칙과 성모 하나하나 운모 하나하나의 표기 방법을 소개한다. 어떤 음소를 어떤 문자로 표현하는지를 명확히 보여주기 위해 주음부호를 기준으로 표기한다.

4.1. 성모(聲母)

성모는 중국어 음절에서 첫머리의 자음을 말한다. 성모의 표기 원칙은 다음과 같다.
||<-2><|2><:> ||<-2><:> 양순음 ||<:> 순치음 ||<-2><:> 치경음 ||<-2><:> 권설음 ||<:> 치경구개음 ||<:> 연구개음 ||
무성음 유성음 무성음 무성음 유성음 무성음 유성음 무성음 무성음
비음 m [m\]
(ㄇ)
n [n\]
(ㄋ)
파열음 무기음 b [p\]
(ㄅ)
d [t\]
(ㄉ)
g [k\]
(ㄍ)
유기음 p [pʰ\]
(ㄆ)
t [tʰ\]
(ㄊ)
k [kʰ\]
(ㄎ)
파찰음 무기음 z [ts\]
(ㄗ)
zh [ʈʂ\]
(ㄓ)
j [tɕ\]
(ㄐ)
유기음 c [tsʰ\]
(ㄘ)
ch [ʈʂʰ\]
(ㄔ)
q [tɕʰ\]
(ㄑ)
마찰음 f [f\]
(ㄈ)
s [s\]
(ㄙ)
sh [ʂ\]
(ㄕ)
r [\ʐ, ɻ\]
(ㄖ)
x [ɕ\]
(ㄒ)
h [x\]
(ㄏ)
접근음
설측 접근음 l [l\]
(ㄌ)

4.2. 운모(韻母)

운모는 중국어 음절에서 성모를 제외한 나머지 부분을 말한다.

4.2.1. 간단한 요약

아래의 상세한 설명을 이해하기 어렵거나 읽기 귀찮은 사람을 위해, 또는 단순히 철자법만 알려는 사람을 위해 간단히 요약했다.

운모의 표기 원칙은 다음과 같다. 표기 방식이 두 가지가 있는 경우는 표의 비고란에 간단히 설명한 다음 다음 단락에서 설명한다.
<colbgcolor=#eee,#191919> 음의 종류 주음부호 한어병음 비고
성모 있음 성모 없음
단운모 a
o
e
ê 감탄사 전용
i yi
u wu
ü/u yu [juquxu]
복운모 ai
ei
ao
ou
부성 운모 an
en
ang
eng
권설 운모 er/r 앞쪽은 단독으로 음절을 이룰 경우, 뒷쪽은 운모를 권설화할 경우
결합 운모 ㄧㄚ ia ya
ㄧㄛ (io) yo 현재에는 감탄사 전용으로 성모 없이 사용됨
ㄧㄝ ie ye
(ㄧㄞ) (iai) (yai) 중화민국 국어에만 존재하는 운모
ㄧㄠ iao yao
ㄧㄡ iu you
ㄧㄢ ian yan
ㄧㄣ in yin
ㄧㄤ iang yang
ㄧㄥ ing ying
ㄨㄚ ua wa
ㄨㄛ uo wo
ㄨㄞ uai wai
ㄨㄟ ui wei
ㄨㄢ uan wan
ㄨㄣ un wen
ㄨㄤ uang wang
ㄨㄥ ong weng
ㄩㄝ üe/ue yue [juquxu]
ㄩㄢ üan/uan yuan [juquxu]
ㄩㄣ ün/un yun [juquxu]
ㄩㄥ iong yong
[clearfix]
참고사항
* ㄩ ü/u, ㄩㄝ üe/ue, ㄩㄢ üan/uan, ㄩㄣ ün/un
* 성모가 j, q, x 중 하나라면 ü를 u로 대체한다. 성모가 l이나 n라면 ü를 사용한다. 현대 표준 중국어에는 lüan, nüan, lün, nün이라는 음절은 없으며 lüan은 예전에 대만 국어에 있었지만 지금은 사라졌다. 즉 ü가 실제로 필요한 경우는 lü, nü, lüe, nüe 네 음절뿐이라고 생각해도 무방하다.
* ㄦ (儿/兒) er/r
* 儿(간화자)/兒(정체자)자가 단독으로 음절을 이룰 때에 兒童(értóng)과 같이 er로 표기하고, 얼화 운미일 때에 花儿/花兒(huār [xʊaɻ], 국어원 표기법: 활?), 一点儿/一點兒(yī diǎnr) 같이 r로 표기한다. 단 r 앞의 운미 (음절말) n을 안 발음하며, yanr/-ianr, yuan/üanr이 [ɪaɿ], //로 발음한다.
* 괄호가 쳐진 -io, yai/-iai는 중화인민공화국 보통화에서 사용하지 않는 것이다.

4.2.2. 상세한 설명

||<|2><-2> ||<-15><:> 운미 ||
/∅/ /i/ /u/ /n/ /ŋ/ /ɻ/
운두 /∅/ -i \[ɻ̩, ɹ̩\]
(ㄭ[ㄭ])
a \[ɑ\]
(ㄚ)
e \[ɤ\]
(ㄜ)
ê \[ɛ\]
(ㄝ)
o \[o\]
(ㄛ)
ai \[aɪ̯\]
(ㄞ)
ei \[eɪ̯\]
(ㄟ)
ao \[ɑʊ̯\]
(ㄠ)
ou \[oʊ̯\]
(ㄡ)
an \[än\]
(ㄢ)
en \[ə̃n\]
(ㄣ)
ang \[ɑ̃ŋ\]
(ㄤ)
eng \[ɤ̃ŋ\]
(ㄥ)
ong \[ʊ̃ŋ\]
(ㄨㄥ)
er \[ɑɻ\][15]
(ㄦ)
/i/ (y)i \[i\]
(ㄧ)
-ia/ya \[i̯ä\]
(ㄧㄚ)
-ie/ye \[i̯ɛ\]
(ㄧㄝ)
-io/yo \[i̯o\]
(ㄧㄛ)
-iai/yai[16] \[i̯aɪ̯\]
(ㄧㄞ)
-iao/yao \[i̯ɑʊ̯\]
(ㄧㄠ)
-iu/you \[i̯oʊ̯~i̯u\]
(ㄧㄡ)
-ian/yan \[i̯ɛ̃n\]
(ㄧㄢ)
(y)in \[ɪn~i̯ə̃n\]
(ㄧㄣ)
-iang/yang [i̯ɑ̃ŋ\]
(ㄧㄤ)
(y)ing \[ɪŋ~i̯ɤ̃ŋ\]
(ㄧㄥ)
-iong/yong \[i̯ʊ̃ŋ\]
(ㄩㄥ)
/u/ (w)u \[ʊ\]
(ㄨ)
-ua/wa \[u̯ɑ\]
(ㄨㄚ)
-uo/wo \[u̯o\]
(ㄨㄛ)
-uai/wai \[u̯aɪ̯\]
(ㄨㄞ)
-ui/wei \[u̯i, u̯eɪ̯\]
(ㄨㄟ)
-uan/wan [u̯än\]
(ㄨㄢ)
-un/wen \[ʊn, u̯ə̃n\]
(ㄨㄣ)
-uang/wang [u̯ɑŋ\]
(ㄨㄤ)
weng \[u̯ɤ̃ŋ\]
(ㄨㄥ)
/y/ -ü(u)[juquxu]/yu \[y\]
(ㄩ)
-üe(ue)[juquxu]/yue \[y̯ɛ\]
(ㄩㄝ)
-üan(uan)[juquxu]/yuan \[y̯ɛn\]
(ㄩㄢ)
-ün(un)[juquxu]/yun \[ʏn~y̯ə̃n\]
(ㄩㄣ)


운모를 표기 원칙은 다음과 같다. 이하의 '운모, 운두, 운복, 운미' 등의 용어가 잘 이해되지 않는다면 표준중국어 운모를 참고하자. 아래 내용에서도 해당 링크와 상통하는 부분이 많이 있다.

우선 운모는 성모(자음) 이후의 모든 부분을 이르는 것이며, 이 운모가 운두(韻頭), 운복(韻腹), 운미(韻尾)로 이루어진다고 보는 것이다(한자 명칭 그대로 '머리, 배, 꼬리'의 순서). 운미는 또한 모음 운미와 자음 운미로 나뉘어진다.
  • 운두: i, u, ü
  • 운복: a, (o,) e(, ê). 시각에 따라 i, u, ü도 운복으로 볼 수 있으나 일단은 제외한다.
  • 운미
    • 모음 운미: i, u
    • 자음(중 비음) 운미: n, ng

운두 단독, 운복 단독만으로도 운모를 이룰 수 있으니, 이것이 단운모(單韻母)이다.
운복에 모음 운미가 따라 붙으면 이것이 복운모(複韻母)이다.
운복에 자음(중 비음) 운미가 따라 붙으면 이것이 비운모(鼻韻母)이다.
한편 혀를 굴려서 운복 e를 발음하는 권설 운모(捲舌韻母)가 있다.
  • 단운모: ㄚa, ㄛo, ㄜe, ㄝê, ㄧi, ㄨu, ㄩü. ㄛo(오)와 감탄사 ㄝê(e 위에 ˆ을 붙인 기호, 에로 발음함.)는 ㄜe(어)의 이형태이다.
  • 복운모: ㄞ ai, ㄟei(ㄜe(어) + ㄧi(이)가 아닌 ㄝê(에) + ㄧi(이)로 해석된다. ㄧi(이)의 전설성 때문에 ㄜe(어)가 ㄝê(에)로 바뀐 것.], ㄠao[21], ㄡou[ㄡ]
  • 비운모: ㄢan, ㄣen, ㄤang, ㄥeng
  • 권설 운모: 兒er

운두에 운복이 붙을 수 있다.
  • i 운두 + 운복: ㄧㄚia, ㄧㄝie[23]
  • u 운두 + 운복: ㄨㄚua, ㄨㄛuo[24]
  • ü 운두 + 운복: ㄩㄝüe[25]

운두에 '운복 + 운미(모음 운미, 자음 운미 모두 포함)' 조합이 붙을 수 있다. 즉 '운두 + 복운모(= 운복 + 모음 운미)', '운두 + 비운모(= 운복 + 자음 운미)'가 가능하다.
이론적으로는 '운두 3가지(i, u, ü) × (복운모 4가지(ai, ei, ao(←au), ou(←eu)) + 비운모 4가지(an, en, ang, eng))'이므로 도합 24가지가 가능하겠으나, 실제로 쓰이는 것은 아래 15(또는 16)가지이다.
  • 운두 + 복운모(= 운복 + 모음 운미)
    • i 운두 + 복운모: (ㄧㄞiai)[26], ㄧㄠiao[27], ㄧㄡiou[28]
    • u 운두 + 복운모: ㄨㄞuai, ㄨㄟuei
    • ü 운두 + 복운모: 없다.
  • 운두 + 비운모(= 운복 + 자음 운미)
    • i 운두 + 비운모: ㄧㄢian, ㄧㄣin[29], ㄧㄤiang, ㄧㄥing[30]
    • u 운두 + 비운모: ㄨㄢuan, ㄨㄣuen, ㄨㄤuang, ㄨㄥueng
    • ü 운두 + 비운모: ㄩㄢüan, ㄩㄣün[31], ㄩㄥiong[32]

참고로 위 운모들을 운두 기준으로 재분류하면 i 운두 조합은 제치호(齊齒呼), u 운두 조합은 합구호(合口呼), ü 운두 조합은 촬구호(撮口呼)라고 한다. 운두가 없다면 개구호(開口呼)라고 한다.

이상의 운모 결합 구조를 표로 정리하면 아래와 같다.
<colbgcolor=#eee,#191919> 운두
i, u, ü
운복
a, e
모음 운미
i, u
(예시)
자음 운미
n, ng
(운두) 단운모 i, u, ü
(운복) 단운모 a, e(ê, o)
복운모(운복 + 모음 운미) ai, ao(←au),
ei, ou(←eu)
비운모(운복 + 자음 운미) an, ang,
en, eng
운두 + 운복 ia, ie,
ua, uo(←ue),
üa, üe
운두 + 운복 + 모음 운미 (iai), iao(←iau), iei, iou(←ieu),
uai, uau, uei, ueu,
üai, üau, üei, üeu
운두 + 운복 + 자음 운미 ian, iang, in(←ien), ing(←ieng)
uan, uang, uen, ueng
üan, üang, ün(←üen), iong(←üeng)
권설 운모 er

한편 운모의 철자법에서 다음과 같은 유의점이 있으니 살펴보자.
  • ㄧi가 성모 없이 단독으로 쓰일 때는 앞에 y를 추가하여 yi라고 쓴다.
  • ㄨu가 성모 없이 단독으로 쓰일 때는 앞에 w를 추가하여 wu라고 쓴다.
  • ㄩü(운두를 포함한 운모)가 성모 없이 단독으로 쓰일 때는 앞에 y를 추가하는데, 주의할 점은 이때 ü에 있는 움라우트(점 두 개)를 생략한다. 결국 최종적으로 보이는 것은 yu.
  • ㄧi 운두 + 운모가 성모 없이 쓰일 때는 i가 y로 바뀐다(예: ian → yan(표준중국어의 발음 변형에 따라 실제로는 '옌'처럼 발음한다.)). 운미 유무 상관없이 운두와 운복을 갖췄으면 다 적용된다(예: iang → yang). 단 운복을 생략할 경우에는 'y'가 아니라 'yi'로 바뀐다.
  • ㄨu 운두 + 운모가 성모 없이 쓰일 때는 u가 w로 바뀐다(예: uai → wai). 운미 유무 상관없이 운두와 운복을 갖췄으면 다 적용된다(예: uang → wang). 단 운복이 생략될 경우에는 'w'가 아니라 'wu'로 바뀐다.
  • 이외에 ㄩü가 j, q, x 뒤에 후속할 때도 움라우트가 빠진다. 그러므로 qu를 '추'처럼 읽지 않도록 주의하자. qu는 ㄑㄨ가 아니라 ㄑㄩ다. 참고로 j, q, x는 설면음으로 설근음(g, k, h)과 설치음(z, c, s)이 전설 고모음(ㄧ i [i], ㄩ ü [y])과 결합할 때 구개음화되어 발현되는 구개음이라는 특성상 i, ü를 제외한 다른 운모는 운두가 될 수 없기 때문에 그냥 ㄨu가 올 일이 없다. 그래서 한어병음에서는 표기의 편의를 위해 이런 경우 ü에서 움라우트를 빼고 u로 적게 한 것이다. 하지만 ü가 운모가 될 수 있는 다른 성모인 ㄋn, ㄌl과 함께 쓰일 때는 움라우트가 그대로 들어간다. n과 l 뒤에는 ㄨu가 올 수 있기 때문에 구분을 안 하면 헷갈리기 때문이다.
  • 운모 내의 운복 e가 발음이 약화되어 표기에 반영되지 않거나, o 등 다른 모음으로 표기되는 사례가 많다.
    • e를 포함하는 복운모(ㄟei, ㄡou[ㄡ])
      • ㄟei
        • ㄧi와 더해지면 이론상 ㄧㄟiei가 되겠지만 이런 발음은 없다. 고어에서는 이런 발음이 있었던 걸로 보이는데(鷄 자처럼 한국 한자음에서 받침 없이 ㅖ나 ㅔ로 적히는 일부 발음이 여기에 대응) 현대 관화에서 ㄧi로 병합됐다.
        • ㄨu와 더해진 ㄨㄟ는 글자 그대로 적으면 uei가 되어야 할 것이다. 하지만 실제로는 다음과 같은 이유 때문에 uei라는 표기가 나타나지 않는다.
          • 성모 없는 단독 표기시에는 위 철자 원칙에 의거 wei로 바뀐다.
          • 성모가 있으면 e를 빼고 ui로만 적는다. 이때 성조 부호는 뒤쪽 모음에 붙인다. 외래어 표기법/중국어에서는 이 ui를 그냥 철자에 따라서 '우이'로 적고 있는데, 표기상으로만 e가 빠졌을 뿐 발음상으로는 (전설화되어 '어'가 아니라 '에'가 된) e가 여전히 반영되어 '우에이~웨이'에 가깝게 발음되기도 한다.
        • ㄩü와 더해지면 이론상 ㄩㄟüei가 되겠지만 이런 발음은 없다. iei가 없는 것과 비슷한 이치이다.
      • ㄡou
        • ㄧi와 더해진 ㄧㄡ는 글자 그대로 적으면 iou(체계상 i+e+u)가 돼야 할 것이다. 하지만 실제로는 다음과 같은 이유 때문에 iou라는 표기가 나타나지 않는다.
          • 성모가 없으면 위의 철자 원칙에 의거 i가 y로 바뀌고 you가 된다.
          • 성모가 있으면 (e가 변한) o가 사라져서 iu가 된다. '이어우'나 '요우' 정도로 발음할 수 있으나 안전하게 '이우'로 발음하는 게 낫다.
        • ㄨu와 더해지면 이론상 ㄨㄡuou(체계상 u+e+u)가 되겠지만 이런 발음은 없다.
        • ㄩü와 더해지면 이론상 ㄩㄡüou(체계상 ü+e+u)가 되겠지만 이런 발음은 없다.
    • e를 포함하는 비운모(ㄣen, ㄥeng)
      • ㄣen
        • ㄧi와 더해진 ㄧㄣ은 글자 그대로 적으면 ien이어야 할 것이다. 하지만 실제로는 다음과 같은 이유 때문에 ien이라는 표기가 나타나지 않는다.
          • 성모가 없으면 위의 철자 원칙에 의거 yen이 될 법하지만, ien에서 e가 빠진 in에 y를 첨가한 yin으로 표기한다. 위 두 경우와 다르게, 성모가 없을 때에도 e가 빠진다는 게 차이점.
          • 성모가 있으면 마찬가지로 e가 빠진 in으로 표기한다.
        • ㄨu와 더해진 ㄨㄣ은 글자 그대로 적으면 uen이어야 할 것이다. 하지만 실제로는 다음과 같은 이유 때문에 uen이라는 표기가 나타나지 않는다.
          • 성모가 없으면 위의 철자 원칙에 의거 wen으로 바뀐다.
          • 성모가 있으면 e가 생략되어 un으로만 적힌다.
        • ㄩü와 더해진 ㄩㄣ은 글자 그대로 적으면 üen이어야 할 것이다. 하지만 실제로는 다음과 같은 이유 때문에 üen이라는 표기가 나타나지 않는다.
          • 성모가 없으면 위의 철자 원칙에 의거 yuen으로 쓰일 법하지만,[yu] üen에서 e가 빠진 ün에 y를 첨가하고 움라우트를 뺀 yun으로 표기한다.
          • 성모가 있으면 마찬가지로 e가 빠진 ün으로 표기한다(j, q, x 뒤에 온다면 표기의 편의를 위해 움라우트를 생략하여 un).
      • ㄥeng
        • ㄧi와 더해진 ㄧㄥ은 글자 그대로 적으면 ieng이어야 할 것이다. 하지만 실제로는 다음과 같은 이유 때문에 ieng이라는 표기가 나타나지 않는다.
          • 성모가 없으면 위의 철자 원칙에 의거 yeng이 될 법하지만, ieng에서 e가 빠진 ing에 y를 첨가한 ying으로 표기한다.
          • 성모가 있으면 마찬가지로 e가 빠진 ing으로 표기한다.
        • ㄨu와 더해진 ㄨㄥ은 글자 그대로 적으면 ueng이어야 할 것이다. 하지만 실제로는 다음과 같은 이유 때문에 ueng이라는 표기가 나타나지 않는다.
          • 성모가 없으면 위의 철자 원칙에 의거 weng이다.
          • 성모가 있으면 e가 생략되긴 하는데 ung…이 되는 게 아니라 ong으로 적는다. u는 글씨를 휘갈겨 쓰면 n과 헷갈릴 수 있으니까 o로 대신한다는 법칙이 적용된 것이다. 하지만 ung을 ииg으로 흘려 써서 헷갈릴 수 있는 uug, nng, nug 등은 표준중국어에 없는데도 굳이 ong이라고 쓰게 한 이유는 불명. weng으로 적을 때와 ong으로 적을 때 실제 발음 차이가 있기는 하다. 전자는 '우엉~웡', 후자는 '웅~옹'으로 말이다. ㄨㄥ은 성모가 없을 때는 weng, 성모가 있을 때는 ong으로 읽는 게 원칙인데, 가끔 일부 감탄사·의성어·의태어 등에서는 성모가 없어도 ong으로 읽기도 한다. 예를 들어 의성어 嗡은 사전에 따라 wēng으로도 읽지만 ōng으로 읽어도 된다고 설명하는 자료가 많다. 이런 경우 주음부호로는 두 발음을 명확히 구분해서 적기는 불가능하지만 한어병음으로는 확실히 구분할 수 있다. 이는 weng과 ong, 두 소리를 두고 중화민국 국어와 보통화의 입장이 다르기 때문이다. 중화민국 국어에서는 두 소리를 같은 음운(ㄨㄥ)의 변이음으로 보지만, 보통화는 아예 서로 다른 음운으로 보아 구별한다.
        • ㄩü와 더해진 ㄩㄥ은 글자 그대로 적으면 üeng이어야 할 것이다. 하지만 실제로는 다음과 같은 이유 때문에 üeng이라는 표기가 나타나지 않는다.
          • 성모가 없으면 위의 철자 원칙에 의거 yueng(위엉)이 될 법하다.[yu] 그러나 üeng에서 원순 모음 ü(위)가 비원순 모음 i(이)로 바뀌고, 비원순 모음 e(어)는 원순 모음 o(오)로 바뀐다. 그래서 iong이 되며, 성모가 없으므로 위 표기 규칙에 따라 i를 y로 바꾸어 yong이 된다.
          • 성모가 있을 때에는 (위에서 보았던 변화에 따라) iong으로 표기한다.
            ※ 사실 중국어 전통 성운학의 사호(四呼)에서의 운모 분류와 한어병음 철자에 의한 분류가 달라져서 약간 떡밥이 되기도 한다. ㄩㄥ은 전통 성운학에 따르면 촬구류(ü 계열 운모)이지만 병음 철자만으로는 제치류(i 계열 운모)로 생각되기 쉬운 것.[36] 이론상 ü 계열이나, 실제 발음상으로는 i 계열이라고 따로 외워야 한다.

4.2.3. 공운(영운모), 얼화 운미, 어깻점(격음 부호)

  • 주음부호로는 (ㄭ(帀)라는 특수한 부호가 있기는 하지만) 표기하지 않는 zh, ch, sh, r, z, c, s 뒤의 운모(보통 /ɨ/로 보지만, 모음화된 /z/로 보기도 한다.)는 i로 표기한다. 웨이드-자일스 표기법의 ih/ŭ에 대응된다.
  • 얼화 운미 兒은 r로 표기하는데, (실제 발음과 상관없이) 얼화가 없을 때의 앞 글자 병음 표기에 r를 덧붙인다. 가령 邊兒는 발음이 biār(뱔)이지만 biānr로 표기한다. 하지만 한어병음을 이용한 대다수의 중국어 입력기(IME)에서는 일반적으로 얼화 운미를 r이 아닌 er 또는 'er로 입력해야 한다. 그래서 邊兒은 bianr이 아니라 bian'er로 입력해야 한다. 발음 입력 시 성조 번호를 입력하여 다른 성조를 가진 한자를 배제하는 기능을 포함하는 입력기에선 얼화 운미 r을 경성인 er로 간주한다. 이런 입력기에서 성조 번호까지 입력한다면 bian1er5나 bian1er0로 입력해야 한다.
    • 단어의 맨 앞에 있는 a/e/o나 하이픈(-) 바로 뒤의 a/e/o에는 어깻점을 추가하지 않는다.
  • a, e, o 중 하나로 시작하는 음절이 다른 음절의 바로 뒤에 붙으면 무조건 그 a/e/o 앞에 어깻점(’가 정석이고 정식 출판물도 이 형태로 출력하지만 컴퓨터 입력 시에는 '이 일반적이다.)을 찍는다. 이는 기본적으로 음절 구분상의 혼동을 방지하기 위해서이다. 예를 들어 piao는 한 음절이고 pi'ao는 두 음절이며, fangan은 fan+gan이고 fang'an은 fang+an이다.
    • 지명 표기 등에서는 성조 부호만 생략할 수 있다. 어깻점과 n이나 l 뒤에 ü의 움라우트는 절대 생략할 수 없다. 감탄사용 부호인 ê 위의 삿갓도 생략할 수 없다. 생략 가능한 부호는 오로지 성조 부호뿐이라고 보면 된다.
    • 어깻점 안 찍어도 음절의 구분이 확실할 때도 반드시 찍어야 한다. 예를 들면 ke와 ai가 연달아 나온다면 절대로 keai로 쓰면 안 되고 ke'ai로만 적는다. 물론 ke'ai에서 굳이 어깻점이 없이 keai라고 쓰더라도 e와 a 사이에 음절경계가 있음을 알 수는 있다. ea나 eai라는 복운모가 없기 때문에 e와 a 사이에 음절이 갈린다. 하지만 그래도 반드시 ke'ai 식으로 어깻점을 찍도록 규정하고 있다. a, e, o는 성모가 없을 때 철자 변형 규칙이 없어서 어깻점이 꼭 필요한 경우가 있다. 그런데 a, e, o 앞에 어깻점이 꼭 있어야 하는 경우와 없어도 되는 경우를 판단하기가 헷갈릴 수 있다. 그래서 한어병음에서는 다른 음절의 바로 뒤에 a, e, o 중 하나로 시작하는 음절이 붙었다면 반드시 '을 찍도록 강제함으로써 실수할 가능성을 줄이려는 것이다. 아니면 영어 isn't, you're 등의 apostrophe(')를 생략하지 않는 것과 비슷하다고 생각해도 된다. apostrophe 없이 isnt, youre 등으로 써도 충분히 알아볼 수 있지만 그래도 여전히 apostrophe를 넣은 isn't, you're 등으로 쓰는 것이 옳듯이, 병음 ke'ai도 어깻점 없이 keai로 써도 충분히 알아볼 수 있지만 그래도 여전히 ke'ai로 쓰는 것이 옳다고 생각하면 된다.
      • i, u, ü는 이런 규정이 없다. 이들 모음은 별도의 부호를 사용하지 않고서도 다른 음절과 붙여 썼을 때 음절을 쉽게 구분하기 위해 성모가 없으면 철자가 y나 w로 시작하도록 바뀌기 때문에 y나 w만 봐도 이게 새 음절의 시작임을 알 수 있으므로 어깻점이 전혀 필요없다.
      • 성모 없이 i/u/ü로 시작하는 음절의 철자를 언제나 y나 w로 시작하도록 기계적으로 바꾸는 규칙이 성모 없이 a/e/o로 시작하는 음절에도 똑같이, 알파벳이 아니라 부호를 사용해서, 기계적으로 적용한다고 생각하면 된다. 즉 i, u, ü는 y나 w로 새 음절의 시작점을 보이듯이, a, e, o는 어깻점으로 새 음절의 시작점을 보인다고 생각하면 된다. 그리고 a, e, o 앞에 언제나 어깻점을 찍어 주면 병음 음절 경계를 파악하는 프로그램을 만드는 데에도 도움이 된다. 어깻점이 있으면 그냥 그 위치에서 자동으로 나누면 되지만, 어깻점이 없다면 앞뒤에 무슨 글자가 있는지를 보고서 가능한 조합인지 아닌지를 판단하고 음절 경계를 추측해야 하는데, 특히 성조 부호가 생략된 병음을 다룰 때 주의해야 한다. 예를 들어 ao는 일단 그대로 두되 aou는 a'ou로 끊어야 하고, 똑같은 ie여도 xie는 그대로 두되 zie는 zi'e로 끊어야 한다. 즉 어깻점이 없다면 프로그램이 음절경계를 따지게 하는 알고리즘을 짜기가 상당히 복잡해진다.
      • 만약 혼동이 없을 때 어깻점의 생략을 허용한다면 Tian'anmen 같은 단어에서 논쟁이 생기게 된다. 어떤 사람은 표준중국어에 tia라는 음절이 없으니 어깻점이 없어도 상관없다고 할 수도 있고, 다른 사람은 표준중국어에 ia라는 운모 자체는 존재하니 어깻점이 꼭 있어야 한다고 할 수도 있다. 반면 a/e/o로 시작하는 음절 앞에 무조건 어깻점을 찍도록 하면 이런 논쟁 자체가 생기지 않는다.
    • 성조 부호를 생략하고 쓴다면 어깻점이 있어야 음절경계가 있음을 확인할 수 있지만, 성조 부호를 쓴다면 어깻점을 생략해도 음절경계가 있음을 아는 예가 있다. Xī'ān이 그 예이다. 이 경우 성조 부호를 생략하면 Xi'an처럼 어깻점을 달아야지, 안 달면 1음절의 Xian과 혼동된다. 하지만 성조 부호를 달면 Xīān이라고 어깻점을 안 써도 i와 a 사이에 음절 경계가 생김을 알 수 있다. 성조 부호는 한 음절에 하나만 쓰기 때문이다. 하지만 그래도 Xīān 식이 아니라 Xī'ān으로 적게 하고 있다. Xīān 같은 표기를 허용하면, 성조부호 생략 시 새로 어깻점을 찍어 주어야 하는지 여부를 일일이 체크해야 하는데 이러면 헷갈려서 실수할 수가 있다. 그래서 한어병음방안에서는 이런 경우에도 무조건 어깻점을 찍게 한다.
    • 어깻점은 오로지 a나 e나 o 앞에만 올 수 있고, 다른 위치에 오지 않는다. 따라서,
      • 모음 + n + a/e/o 구조에서 음절 경계는 자동으로 모음과 n 사이에 있다(즉 모음은 앞 음절에, n은 뒤 음절에 속한다). 따라서 모음과 n 사이에 음절 경계가 있다면 모음과 n 사이에 어깻점을 찍지 않아야 맞는다. 반대로 n과 a/e/o 사이에 음절 경계가 있다면 반드시 n과 a/e/o 사이에 어깻점을 찍어야 한다.
        • 예: 濟南 Jǐnán (jǐ+nán), 金安 Jīn'ān (jīn+ān)
      • 모음 + ng + a/e/o 구조에서 음절 경계는 자동으로 n과 g 사이에 있다(즉 n은 앞 음절에, g는 뒤 음절에 속한다). 따라서 n과 g 사이에 음절경계가 있으면 n과 g 사이에 어깻점을 찍지 않아야 맞는다. 반대로 ng와 a/e/o 사이에 음절 경계가 있다면 반드시 ng와 a/e/o 사이에 어깻점을 찍어야 한다.
        • 예: 反感 fǎngǎn (fǎn+gǎn), 方案 fāng'àn (fāng+àn)

4.2.4. 감탄사·의성어·의태어 등 특수한 운모

일부는 위에서도 각주로 설명은 했지만 다시 정리한다.
  • 한어병음에서 e가 다른 모음과 결합하지 않고 단독으로 있으면 '으(어 장음)' 발음을 나타내고 단순한 '에' 발음은 나타내지 못한다. 하지만 감탄사에는 순수한 '에'가 존재하는데, 이 발음을 표기하고자 할 때에는 ê라는 특수 기호를 쓰고 그 위에 성조 부호를 쓴다. 주음부호에서는 아예 e와 ê 발음을 구분하여 각각 ㄜ와 ㄝ로 할당해 놨다(즉 주음부호에서는 ㄝ는 ㄜ의 변이음이 아닌 별개의 음운으로 간주한다고 볼 수 있다). 또, 한어병음에서 e가 '에'처럼 발음되는 경우 중 ie, üe는 ㄜ가 아닌 ㄝ를 쓰게 하고 있다. ei(에이)는 ㄟ라는 주음부호가 따로 있다.
    • 예를 들어 감탄사로 쓰이는 欸 자는 발음이 엄청 많은데, 이 글자의 발음으로 āi, ǎi, ê̄, ế, ê̌, ề가 있다. 뒤에 있는 네 개가 '에'처럼 읽히는 발음이다.
    • ê는 별로 안 쓰이기 때문에 한어병음을 사용하는 중국어 입력기에서 취급이 서로 다르다. 입력기에 따라 그냥 e에 합치기도 하고 아예 빼기도 하며[37] eh나 ei(Windows 10의 기본 입력기와 iOS의 입력기) 등 새로운 철자 조합을 만들기도 한다. 한어병음 익힐 때 ê라는 기호를 가르치는 곳이 거의 없다.
  • 단모음으로 발음되는 o(ㄛ)는 원래 입술소리인 b, p, m, f 뒤에서만 나타나고, 나머지는 uo/wo(ㄨㄛ)가 나타난다. 하지만 경성 등에서 종종 b, p, m, f 외의 성모가 있거나 성모 없이 o(ㄛ)만 쓰기도 하는데, o로 표기하면 된다. 예를 들어 咯 자의 발음 중에 lo(경성)가 있는데 이런 특수 케이스에 해당된다.
  • 감탄사 중에 '이오' 내지 '요' 정도로 발음하는 것이 있는데, io(성모가 없으면 yo)로 적으면 된다. 예를 들면 감탄사 哎哟(āiyō)가 여기에 속한다.
  • 噷은 hēn, hèn, xīn, 哼은 hēng 또는 hèng이 정식 발음이지만, 의성어로 쓸 때 hm(ㄏㄇ)이나 hng(ㄏㄫ[38])으로 기재하기도 한다. 대강 '흠', '흥' 정도의 감탄을 옮겨 적은 것인데 모음이 없다 보니 성조를 엄격하게 기재하지 않는 것 같다. 보통 이 발음을 사전에 기재하면 대체로 경성으로 정리하는 듯하다. 한어병음방안 원문에는 이런 음에 대한 규정이 없지만, 사전에 종종 등장한다. 예를 들어 고려대학교 민족문화연구원에서 출간하고 고려대학교 민족문화연구원 중국어대사전편찬실이 편찬한 '혁신판 현대중한사전'에 hm(噷)과 hng(哼)이 실려 있다. 그리고 구글 등에서 이 두 한자를 검색해 보면 중국어권 온라인 사전 사이트에 hm과 hng이 발음으로 기재된 것이 흔하다. 이런 감탄사에서 성조를 달아야 한다면 m, n 위에 성조 부호를 달기도 한다. 현대 한어 사전(現代漢語詞典) 7판(2016년)에는 hm, hng, m̄, ḿ, m̀, ń, ň, ǹ, ńg, ňg, ǹg 등의 음절들이 있다. 한어병음 정사법 기본 규칙에도 Ńg, nǐ shuō shénme? (嗯,你說什麼?)와 Hng, zǒuzhe qiáo ba! (哼,走着瞧吧!)라는 문장들이 등장한다. 또한 한어대사전에 呒, 呣, 唔, 嗯 등의 발음을 기재할 때 m이나 n(ng일 경우도 포함) 위에 성조 부호를 단 발음을 기재하기도 했다고 한다.

4.3. 성조(聲調)

성조는 기호로 표시한다. 한어병음방안에서는 1~4성 기호는 한 음절의 어느 한 모음 글자 위에 찍도록 했다.
  • 1성(음평성, 陰平聲)은 ˉ(āēīōū).[39]
  • 2성(양평성, 陽平聲)은 ´(áéíóúǘ). 올라가는 소리이므로 사선을 아래에서 위로 올려 그어야 한다는 불문율이 있으나, 아래에서 위로 긋든 위에서 아래로 긋든 딱히 강제하진 않는다.
  • 3성(상성, 上聲)은 ˇ. 뾰족한 caron(ˇ, ǎěǐǒǔǚ)이고, 둥그런 breve(˘, ăĕĭŏŭ)가 아님에 주의할 것. 가끔씩 3성 두 개가 연달아서 오면 둘 중 앞에 있는 것이 2성으로 발음하기도 한다(예: 발음상 nǐ hǎo → ní hǎo). 일부는 이렇게 본래의 발음이 아니라 변한 발음을 기준으로 쓰기도 한다. 규정상으로는 본래의 성조를 쓰는 것(예: nǐ hǎo)이 원칙이나, 교육목적상 필요하다면 바뀐 성조(예: ní hǎo)로 쓸 수도 있다고 되어 있다.
  • 4성(거성, 去聲)은 `(àèìòùǜ).
  • 경성(輕聲)은 기호를 쓰지 않는 것을 원칙으로 한다. 하지만 경성임을 명확히 표시하고 싶다면 음절 앞에 가운뎃점(·)을 찍는다. 예를 들어 什麼는 shénme라고 적지만, 麼(me)가 경성임을 강조하고 싶다면 shén·me라고 쓰면 된다. 주음부호(필기나 정식 인쇄물 한정. 컴퓨터 입력은 관행상 해당 안 됨) 등에서도 경성을 표시할 때 해당 음절 앞에 쓰는 게 원칙이다. 다른 성조와 성격이 다르기 때문에 구분을 하던 게 정착된 듯하다. 그런데 만약 한어병음에서 경성 부호를 한어병음의 다른 성조처럼 모음 위에 보조 부호를 더하는 식으로 쓰게 했다면 문제가 생겼을 것이다. i에 성조 부호를 찍을 때는 i 위의 점을 지우고 그 자리에 성조 부호를 쓰는데, 만약 경성을 나타내는 점을 i에 결합한다면 모양이 똑같아서 구분이 안 된다. 그렇다고 경성만 예외로 i 위에 점을 하나 더 덧붙이는 식으로 쓰면 모양이 이상하다. 따라서 점을 경성 기호로 쓴다면 음절 앞에 쓰는 게 낫다는 걸 알 수 있다.
    • 본래 한어병음방안 원문에서는 경성이라면 성조 표기를 하지 않도록 규정했을 뿐 가운뎃점을 음절 앞에 붙이라곤 하지 않았지만, 한어병음 정사법에서는 사전에서 음을 표기할 때 경성 음절의 앞에 가운뎃점을 찍음을 허용한다.
      • 일부 사전에서는 경성으로 읽기도 하고 아니기도 한 소리를 가운뎃점과 1~4성 성조 부호를 같이 써서 나타내기도 한다. 예를 들어 méi·yǒu라는 표기는 두 번째 음절을 3성(yǒu)으로도 읽을 수 있고 경성(·you)으로도 읽을 수 있다는 뜻이다. 이것도 정사법에서 사전에 한정하여 허용한다.
      • 경성을 언제나 가운뎃점으로 표기하는 사전으로는 現代漢語詞典이 있다. 참고로 現代漢語詞典은 a/e/o로 시작하는 경성 음절이 단어의 중간이나 끝에 있다면 가운뎃점만 넣고 어깻점은 넣지 않는다(예: 吊兒郎當 diào·erlángdāng. 경성을 표기하지 않는 일반적인 방식에 따르면 diào'erlángdāng과 같이 어깻점이 들어가야 함).

4.3.1. 성조 부호를 찍는 모음자

4.3.1.1. 간단한 요약
아래의 상세한 설명을 이해하기 어렵거나 읽기 귀찮은 사람을 위해, 또는 단순히 철자법만 알려는 사람을 위해 간단히 요약했다.
  • 모음 글자가 하나만 있으면 그 글자에 성조 부호를 찍는다.
  • 모음 글자가 둘 이상 있으면 아래 표에서 2성 부호(´)가 붙은 글자에 성조 부호를 찍는다.
<colbgcolor=#eee,#191919> +a +e +i +o +u
a ái áo
e éi
i iá, (iái,) iáo
o óu
u uá, uái
ü (üá) üé
4.3.1.2. 상세한 설명
성조 부호를 찍는 모음 글자는 다음과 같이 정한다.
  • 모음 글자(a, e, i, o, u, ü)가 하나만 있으면 거기에 찍는다. 단, i에 성조 부호를 더할 때는 i 위에 있는 점을 쓰지 않고 점이 들어갈 자리에 성조 부호를 더한다.
  • 둘 이상이면 운복에 찍는다.
    • 다만 운복이 철자상으로 생략된 경우 운미의 모음 글자에 찍는다..

두 번째 규칙을 좀 더 쉽게 말하면, 모음 글자 중 처음 나오는 것이 i, u, ü면 두 번째 모음 글자에, 그 이외는 첫 번째 모음 글자에 찍는다.

위의 원칙은 언어학과 주음부호의 구조[40]를 어느 정도 알 수 있으면 당연하게 느낄 수 있으며 설사 모르더라도 간단한 원칙으로 직관적인 이해가 가능한 규칙이다.

하지만 보통 교재에서는 아래와 같이 복잡하게 서술한다. 아래 설명은 중국 본토 발행 외국인을 위한 중국어 학습서에서 서술한 방법이며, 웬만한 국내 교재도 이것을 따른다(영어권 교재에서 위의 방식을 따른 경우도 있다). 교재가 이런 식으로 되어 있다 보니 가르치는 사람도 이 방식대로 하고 있다.
  • 모음 글자가 하나만 있으면 거기에 찍는다.
  • 모음 글자가 둘 이상 있을 때는 a > o, e > i, u, ü 순서로 찍는다. 이 순서는 입을 벌리는 정도와 똑같다. 예를 들어 ao는 a>o이므로 a에 찍는다 (위의 원칙대로면 i나 u로 시작한 것이 아니므로 그냥 첫 번째 모음 글자 a에 찍는다). 또한 o와 e는 같이 오지 않으며, ü는 단독으로 있을 때나 üe를 제외하고는 표기되는 일이 없다.
  • i와 u가 나란히 올 경우에는 뒤에 있는 모음 글자에 찍는다.

4.4. 띄어쓰기, 하이픈, 대문자 처리

쭉 붙여 쓰는 중국어의 한자 표기와는 달리[41] 한어병음방안 표기에서는 단어마다 띄어 쓴다.(음절 단위로 띄어 쓰지 않는다.)
  • 한 단어의 예:
    • péngyou (朋友)
    • fēicháng (非常)
    • túshūguǎn (圖書館)
    • duìbuqǐ (對不起)
  • 여러 단어의 예:
    • huánjìng bǎohù guīhuà (環境保護規劃)
    • jīngtǐguǎn gōnglǜ fàngdàqì (晶體管功率放大器)

문장의 첫 글자와 고유 명사의 첫 글자는 대문자로 쓴다. 여러 단어로 이루어진 고유 명사의 경우, 각 단어의 첫 글자를 대문자로 쓴다.
  • 예:
    • Běijīng (北京)
    • Tīng míngbai le ma? Wèi! (聽明白了嗎?餵!)
    • Zhōnghuá Mínguó (中華民國)

다만 '한 단어'인가 '두 단어'인가를 가르는 기준, 또는 고유 명사의 기준이 애매한 경우가 있어서 사람마다 띄어쓰기나 대문자 처리가 다른 경우도 있다. 이것은 중국어만이 아니라 모든 언어가 다 그렇다. 예를 들어 영어에서도 website와 web site, cellphone과 cell phone 등이 혼용되고, Internet으로 쓰기도 하고 internet으로 쓰기도 한다. 가령 중국어에서 中文 자체가 고유명사인가, 아니면 中만 고유명사이고 文은 일반명사인가? 중국 대륙에서는 전자, 대만에서는 후자로 보는 것 같다. 대만의 초중고 교과서에서는 고유명사에 가로쓰기라면 밑줄, 세로쓰기라면 옆줄(왼쪽)을 그어주기 때문에 이로 파악이 가능하다. 2010년대에 중국에서는 띄어쓰기에 대한 좀 더 명확한 기준을 제시했다.

인명은 성씨와 이름을 별개의 단어로 보며, 성씨와 이름 사이만 띄어 쓰고 나머지는 붙여 쓴다. (물론 성씨의 첫 글자와 이름의 첫 글자는 대문자로 쓴다.)
  • 예:
    • Wáng Jiànguó (王建國)
    • Yáng Wèimín (楊為民)
    • Mǎ Běnzhāi (馬本齋)
    • Méi Lánfāng (梅蘭芳)
  • 성씨의 경우 복성(复姓)은 그냥 쭉 이어 쓰고, 쌍성(双姓)은 중간에 하이픈(-)을 넣는다(이때 하이픈 바로 뒤의 글자는 대문자로 쓴다).[42]
    • 복성의 예:
      • Zhūgě Zhìchéng (諸葛志成)
      • Ōuyáng Wén (歐陽文)
      • Shàngguān Xiǎoyuè (上官曉月)
    • 쌍성의 예:
      • Zhào-Lǐ Shūgāng (趙李書剛)
      • Liú-Yáng Fān (劉楊帆)
      • Chén-Yán Ruòshuǐ (陳言若水)
  • 본래 중국어 인명이 아닌 인명을 한어병음으로 쓸 일이 있을 때도 위 규칙을 따른다.

지명의 경우, 뒤쪽의 일반 명사 부분(행정구역 단위, 자연지물 종류, 인공축조물 종류 등을 나타내는 부분)은 앞쪽의 고유 명사 부분과 띄어 쓰고, 각 단어의 첫 글자는 대문자로 쓴다. 하이픈을 넣거나 그냥 이어 쓰는 한국의 현행 로마자 표기법과 다르므로 주의할 것.
  • 예:
    • Běijīng Shì (北京市)
    • Héběi Shěng (河北省)
    • Yālù Jiāng (鴨綠江)
    • Tài Shān (泰山)
    • Dòngtíng Hú (洞庭湖)
    • Táiwān Hǎixiá (臺灣海峽)
다만 일반 명사 부분으로 끝나더라도, 해당 일반 명사 부분이 실제 행정 구역 단위, 자연 지물 종류, 인공 축조물 종류 등과 일치하지 않는다면 해당 일반 명사 부분까지 고유 명사로 보고 이어 쓴다.
  • 예:
    • Hēilóngjiāng (黑龍江 (성(省)의 이름))
    • Wángcūn (王村 (진(镇)의 이름))
    • Jiǔxiānqiáo (酒仙橋 (병원(醫院)의 이름))
그래서 黑龍江이 강(江)을 가리킨다면 고유 명사 黑龙 + 일반 명사 江 구조이므로 Hēilóng Jiāng으로 띄어 쓰지만, 성(省)의 이름이라면 黑龍江 전체가 고유명사 한 단어이므로 Hēilóngjiāng으로 붙여 쓴다.[43]

한어병음에서 하이픈(-)은 일부 복합어와 일부 성어(成語)에 쓰인다(그리고 상술했듯이 쌍성에도 쓰인다). 음절 구분 용도가 아니므로 주의할 것.
  • 복합어의 예:
    • zhōng-xiǎoxué (中小學)
    • lù-hǎi-kōngjūn (陸海空軍)
  • 성어의 예:
    • fēngpíng-làngjìng (風平浪靜)
    • shuǐdào-qúchéng (水到渠成)

AABB 구조의 중첩 병렬은 1996년판에서는 AA와 BB 사이에 하이픈을 넣어 썼으나, 2012년 개정판에서 하이픈 없이 그냥 쭉 이어서 쓰도록 바뀌었다.
  • 예: 清清楚楚 qīngqīngchǔchǔ (과거 qīngqīng-chǔchǔ)

긴 문장을 표기한 예를 들어 보자면 다음과 같다.
  • Nàmùwéijī, dàjiā gòngtóng péiyǎng de yī kē zhīshi zhī shù. (納木維基,大家共同培養的一棵知識之樹。 나무위키, 여러분이 가꾸어 나가는 지식의 나무.)

더 자세한 규정은 한어병음 정사법 기본 규칙 문서를 참고할 것.

한어병음을 음절 단위로 띄어 쓰는 사례를 종종 볼 수 있지만 적절치 않다.[44] 만약 한어병음이 음절 단위로 띄어 쓰는 방향이었다면 어깻점이나 i/u/ü로 시작하는 음절의 철자 변형이 필요 없었을 테고, 한어병음 정사법(正詞法)도 필요 없었을 것이다. 그러나 어깻점을 도입한 것과 i/u/ü로 시작하는 음절의 철자를 y나 w로 시작하도록 만든 것, 그리고 띄어쓰기나 하이픈 사용법 등을 규정하는 한어병음 정사법을 따로 제정한 것은 한어병음이 처음부터 음절 단위가 아니라 단어 단위로 띄어 쓰는 것을 확고하게 염두에 두고 만들었음을 잘 보여준다. 현대 중국어의 음절 구조가 간단한 편이고, 한어병음 자체도 쭉 붙여 써도 음절 구분이 잘 되도록 설계했기 때문에 음절별로 나눠 써야 할 필요도 없다. a, e, o에 한해서 어깻점을 동원하기는 하지만, 이것도 y나 w와 비슷한 영성모 표기용 글자로 보면 딱히 문제가 없다. 오히려 한어병음을 단어별로 띄어 쓰는 게 중국어 학습자에게는 훨씬 더 도움이 된다. 단어를 파악하는 데 도움을 주기 때문이다.

한어병음 정사법이 '단어 단위로 띄어 쓴다.'는 원칙을 정의함에 그치지 않고 꽤 자세하므로, 한어병음 정사법 제정자들은 중국어를 한자가 아니라 한어병음으로'만' 적는 상황도 어느 정도 염두에 둔 듯하다. 특히 줄 바꾸기 규칙(移行規則)이 있음을 보면 더욱 그렇다. 또한 얼화 운미를 실제 발음과 상관없이 단순히 r만 덧붙이게 하는 것, 앞뒤 음절로 인한 성조 변화(變調(변조), tone sandhi)를 원칙적으로 반영하지 않는 것 등도, 본래의 형태를 유지하여 한어병음으로만 적힌 글을 보고서도 무슨 단어인지 쉽게 파악할 수 있도록, 또는 적어도 무슨 단어인지 파악하는 데에 지장이나 부담을 덜 주려는 목적인 것 같다.

미국의 중국학자이자 중어중문학 교수인 Victor H. Mair는 zhéxué (哲學), fēijī (飛機), diànnǎo (電腦), rùnsè (潤色), túshūguǎn (圖書館) 등의 '단어'를 예로 들며 한어병음을 음절 단위로 띄어 쓰지 말라고 한다. 예를 들어 zhéxué라는 하나의 단어는 철학(philosophy)을 뜻하지만 zhé xué라는 두 단어의 나열은 그저 '현명한 학습(sagacious learning)'일 뿐이고, diànnǎo라는 하나의 단어는 컴퓨터(computer)를 뜻하지만 diàn nǎo라는 두 단어의 나열은 그저 '전기 뇌(electric brain)'일 뿐이며 '번개 뇌(lightning brain)'가 아니고?, túshūguǎn이라는 하나의 단어는 도서관(library)을 뜻하지만 tú shū guǎn이라는 세 단어의 나열은 그저 '그림 책 홀(picture book hall)'일 뿐이라고 한다. 한 음절이 한 단어에 대응되는 단음절 언어였던 고대 중국어와는 달리 현대 중국어는 여러 음절로 이루어진 단어가 많아 통념과는 달리 단음절 언어라 보기 어렵고[45] 따라서 음절 단위로 띄어 쓰는 것은 적절하지 못하다.

5. 한어병음자모와 한어병음방안의 차이

한어병음자모와 한어병음방안은 미묘하게 다르다. 한어병음방안은 중국어의 발음을 표기하는 수많은 방식 중 하나이고, 한어병음자모는 한어병음방안에 의해 중국어를 표기할 때 사용하는 문자를 말한다. 즉 한어병음자모란 a, b, c, d… 등을 가리키고, 한어병음방안은 中의 발음을 표기할 때 다른 철자가 아닌 zhōng을 사용한다는 의미이다(한국으로 비유하면 한어병음자모는 한글 그 자체, 한어병음방안은 한국어 맞춤법에 해당한다). 즉 중국어 교재의 연습 문제에서 한자로 적힌 문장을 주고 한어병음자모(또는 한어병음방안)로 표기하라는 지시문은 실제로는 '한어병음자모를 이용하여 한어병음방안의 규정에 맞게' 표기하라는 뜻이다.

한어병음방안 원문에 나온 한어병음자모의 이름은 다음과 같다. 흔히 알려진 영어 이름보다는 라틴어독일어에서 쓰이는 이름과 비슷하다. 원문에는 이름이 주음부호로만 적혀 있으며, 괄호 안의 한어병음 (응용) 표기는 원문에는 없으나 참고용으로 덧붙인 것이다. 중국 교육부에서 제공하는 汉语拼音字母名称读音对照表(한어병음자모 명칭 독음 대조표, 2015년 reprint)에도 똑같은 표기가 나와 있고, 現代漢語詞典 7판에도 똑같은 표기가 나와 있다(참고).
자모 이름 자모 이름
A a ㄚ (a) N n ㄋㄝ (nê)
B b ㄅㄝ (bê) O o ㄛ (o)
C c ㄘㄝ (cê) P p ㄆㄝ (pê)
D d ㄉㄝ (dê) Q q ㄑㄧㄡ (qiu)
E e ㄜ (e) R r ㄚㄦ (ar)
F f ㄝㄈ (êf) S s ㄝㄙ (ês)
G g ㄍㄝ (gê) T t ㄊㄝ (tê)
H h ㄏㄚ (ha) U u ㄨ (wu)
I i ㄧ (yi) V v[46] ㄪㄝ[47] (vê)
J j ㄐㄧㄝ (jie) W w ㄨㄚ (wa)
K k ㄎㄝ (kê) X x ㄒㄧ (xi)
L l ㄝㄌ (êl) Y y ㄧㄚ (ya)
M m ㄝㄇ (êm) Z z ㄗㄝ (zê)

즉 원칙적으로는 한어병음자모 a, b, c, d…는 '에이, 비, 시, 디…'가 아니라 '아, 베, 체, 데…'라고 불러야 한다. 하지만 중국어를 가르칠 때 이건 안 가르쳐 준다.[48] 그리고 사실 오늘날 중국인들도 대부분이 ēi, bī, xī, dī…라고 한다.

참고로 한 논문에는 다음과 같은 서술이 있다.
자모의 명칭에 대한 문제점은 2004년 11월 무한시(武漢市)에서 주관한 ‘한어병음 자모 독음문제에 관한 조사’에서 분명하게 나타난다. 이 조사에 응한 610명의 자모 독음 분포를 살펴보면 영문 자모로 읽는 경우가 77.2%, 〈한어병음방안〉 성모·운모로 읽는 경우가 14.1%, 독음방법을 알지 못해 읽지 못하거나 틀린 방법으로 읽는 경우가 8.7%에 이르렀다. 그러나 조사 결과 현행 〈한어병음방안〉의 자모 명칭으로 읽는 경우는 0%로 나타났다.111)[49] 이처럼 〈한어병음방안〉 자모표에 규정되어 있는 명칭대로 읽는 사람이 한명도 없다는 것은 자모의 명칭이 이미 현대 사회에서는 필요 없는 명칭이며, 도태되고 있다는 증거라 할 수 있다.

111) 王立(2006), 〈《漢語拼音方案》字母名稱音的呼讀問題〉, 《江漢大學學報》 Vol.25 No.4, p.66

– 장미희(2009), 〈漢語拼音方案〉의 역사적 이해와 표기체제 고찰, 103쪽 (PDF 112쪽)

6. 참고

  • 한어병음방안 원문(중국 교육부의 2015년 reprint, 중국어 위키문헌)에는 한자에 발음을 덧붙여 표기할 때(주음할 때) 두 글자짜리 자음들을 한 글자로 줄여 쓸 수도 있다고 했다. 원문에는 zh, ch, sh를 줄여서 각각 ẑ, ĉ, ŝ(z, c, s 위에 ˆ를 덧붙임)으로 쓸 수 있고, ng을 줄여서 ŋ으로 쓸 수 있다고 했다. 예를 들어 zhuang은 ẑuaŋ으로 줄여 쓸 수 있다. 아무래도 한자 위(가로쓰기 시)에 작은 글씨로 발음을 기재할 때 글자 수가 많으면 적기 힘들기 때문에 이런 방식을 고안한 듯하다. 그러나 실제로 이렇게 줄여 쓰는 경우는 없다고 봐도 무방하다.
  • 대만의 중화민국 국어에서는 ㄧㄞ, 즉 한어병음으로 -iai(yai) 정도로 적는 운모를 인정하지만, 보통화에서는 인정하지 않는다. 중화민국 국어에서 -iai(yai)로 발음하는 운모는 보통화에서는 -ia(ya, ㄧㄚ)로 바뀌었다(예: 崖 yái → yá). 한어병음방안 원문에도 이 운모를 제외하고 있다. 물론 굳이 이 발음을 적을 경우 -iai(yai)라고 쓰긴 하며, 이제는 대만도 한어병음을 채택했으므로 중화민국 국어의 발음을 표기할 때에 한해 이 표기를 쓸 일이 많다.
  • 한어병음자모 중에 j, q, x가 채택된 경위는 다음과 같다고 짐작된다(중국어 위키백과의 한어병음 문서를 참고함).
    • 한어병음의 j는 영어의 j와 비슷하여 채택된 것으로 보인다.
    • q는 알바니아어 정도를 제외한 대부분의 언어에서 ㅋ 계통의 음소를 나타내는 경우가 많아 한어병음의 q 발음은 이질감이 심하다. 굳이 q로 ㄑ(주음부호) 발음을 나타내게 한 이유는 일단 남는 글자가 없어서(…)인 것으로 보인다. 그런데 아무렇게나 정한 건 아니다. 현재 한어병음으로 성모가 q로 적히는 한자들 상당수가 원래는 [kʰ] 발음이었다가 구개음화가 진행되면서 지금의 [tɕʰ]로 바뀐 경우로, 방언이나 다른 한자문화권 언어에서는 [kʰ] 비슷한 발음이 남아 있는 경우가 많다. 예를 들어 氣 (qi)는 Zhengzhang Shangfang이 재구한 중고 한어에서 '킈' [kʰɨiH] 비슷한 발음이었으며, 현재도 다른 방언이나 언어에서 '기~키' 계열의 발음으로 읽힌다. 따라서 이 점을 고려해서 ㅋ 계통의 소리가 나는 q를 ㄑ 발음을 나타내는 한어병음자모로 채택한 것으로 보인다.[50][51]
    • x 역시 중세 스페인어, 포르투갈어, 카탈루냐어, 바스크어 등의 몇몇 이베리아 반도 기원 언어들에서나 [ʃ] 비슷한 소리가 난다. 따라서 다른 언어의 철자법과 괴리감이 좀 있는데 채택한 가장 큰 이유는 남는 글자가 없어서겠지만 역시 그냥 정한 건 아니다. 성모가 한어병음으로 x로 적히는 한자 중에 원래는 ㅎ 발음이었다가 구개음화가 진행되면서 지금의 발음으로 바뀐 경우가 많고, 실제로 방언이나 다른 한자문화권 언어에서는 ㅎ 비슷한 발음이 남아 있는 경우가 많다. 예를 들어 下(xià)는 Zhengzhang Shangfang이 재구한 중고 한어에서 '하' [ɦɣa] 비슷한 발음이었으며, 현재도 다른 방언이나 언어에서 '하' 비슷한 발음으로 읽힌다. 이런 이유들 때문에 ㅎ 계통의 소리가 나는[52] x가 ㄒ(주음부호) 발음을 나타내는 한어병음자모로 채택된 것으로 보인다. 물론 相(xiàng)처럼 이런 발음의 변천과 무관한 케이스도 있다. 相 자가 한국어에서 '상'으로 읽히는 것에서 확인할 수 있듯이 이 글자의 경우 본래 성모가 h가 아닌 s였던 경우이다. 하지만 한어병음은 어원을 반영하는 표기법이 아니므로 그냥 xiàng으로 적는다.
  • 관화에 속하는 옛 발음이나 관화의 비표준 방언 발음을 나타낼 때 응용 표기를 사용하는 경우가 있다.
    • 중화민국 북양정부의 인위적 표준어 발음이었던 노국음(老國音)이나 경극의 발음 체계, 또는 일부 관화의 비표준 방언에서는 현대 관화(표준 중국어) 이전 시기의 관화를 사용하기 때문에 현대 관화에 없는 음절도 존재한다. 예를 들어 현대 표준중국어에는 사라진 발음인 ziang(ㄗㄧㄤ), sio(ㄙㄧㄛ), süo(ㄙㄩㄛ) 등이 경극에서 사용된다고 한다. 이런 발음은 그냥 한어병음 표기법을 응용해서 옮겨 적으면 된다. 이 역시 일반적으로 쓸 일은 없다.
    • 노국음이나 비표준 관화 방언에서는 z+이, c+이, s+이, 즉 주음부호로 옮긴다면 ㄗㄧ, ㄘㄧ, ㄙㄧ 같은 발음이 나오기도 한다. 근데 이런 발음은 굳이 한어병음으로 표기하려고 할 경우 문제가 생긴다. 한어병음에서는 zi, ci, si를 찌, 치, 씨가 아니라 쯔, 츠, 쓰처럼 읽어야 하기 때문이다. 그래서 z+이, c+이, s+이 식의 발음을 굳이 적어야 할 때는 zii, cii, sii처럼 적기도 하는 모양이다(성조 부호를 쓸 때는 두 번째 i에 덧붙인다. 즉 ciī처럼). 예를 들면 영어 위키백과의 주음부호(Bopomofo) 문서에 ciī가 사용되었다. #(본 위키의 주음부호 문서에서도 (글 내용이 많으니 F3나 Ctrl+F를 누른 뒤 ciī를 복사·붙여넣기해서 찾는 게 빠르다.) 위키백과와 동일하게 이 표기를 사용하였다) 단 이것은 한어병음방안 원문에 적혀 있지 않으니 비표준 표기법이다. 어차피 이런 발음을 한어병음으로 표기해야 할 일도 거의 없고 표준 표기법도 아니니까 몰라도 된다
    • 노국음이나 비표준 관화 방언에서는 [ŋ](ㄫ·兀)이 성모로도 발음되는데 이런 발음을 한어병음을 응용해서 적을 땐 음절이 ng로 시작하게 된다. [ʋ\](사실 이쪽이 더 정확하다.) 또는 [v\] 정도로 발음되는 ㄪ(万), [ɲ̟\]~[n̠ʲ\][53]으로 발음되는 ㄬ(广)가 성모로 존재하는데, 전자는 v로, 후자는 통일되지 않았지만 대개 ny, gn의 표기로 나타낸다. 단, 이런 발음까지 고려할 경우 기존 한어병음 체계의 음절 구분(') 규칙보다 복잡해질 수 있고, 또한 후술할 대체 표기(ü를 yu나 v로 고정 표기하는 것 등등)와 충돌할 수 있어서 주의가 필요하다.
    • 노국음, 20세기 초까지의 베이징 독서음(중국어에서는 구어에서 쓰이는 한자 발음이 아닌 글을 읽을 때만 사용하는 한자 발음이 따로 있는 방언들이 꽤 있는데, 후자를 독서음이라고 한다.) 난징 관화 등에서는 어말에 성문 폐쇄음 [ʔ\]을 수반하는 입성(入聲) 발음이 성조의 하나로 취급된다. 이런 발음을 한어병음을 응용하여 적는 방법은 고안돼 있지 않지만, 성조 부호 없이 음절 말에 h[54]를 덧붙이는 방법 등이 쓰인다.[55]

6.1. A, G의 소문자(와 2성 부호(´)의 자형)에 대해

1 2
[math(\rm\Large a)] [math(\Large ɑ)]
[math(\rm\Large g)] [math(\Large ɡ)]

무슨 이유에서인지 병음을 컴퓨터로 출력할 때 일부러 2번의 [math(\rm ɑ)], [math(\rm ɡ)](국제음성기호)로 대체해서 쓰는 경우가 종종 보이지만, 그냥 1번 같은 글꼴로 출력해도 전혀 문제없다. 한어병음방안은 어디까지나 철자법을 규정한 것이지 글자의 모양을 규정한 것이 아니기 때문이다. 한어병음방안 1958년 원문에도 중국 교육부의 2015년 reprint에도 1번의 [math(\rm a)], [math(\rm g)]가 사용됐다(2번의 [math(\rm ɑ)], [math(\rm ɡ)]는 아예 사용되지도 않았다).

그리고 W3CRequirements for Chinese Text Layout 中文排版需求에는 다음과 같은 내용이 있다.
It is generally the opinion in publishing and in education that Hanyu Pinyin must use those typefaces in which ‘a’ and ‘g’ are single story[56] and the second tone mark is thick on the lower part and thin on the upper, as in the handwritten style of the stroke. Actually there have never been any national standards specifying the typefaces and the glyphs for Hanyu Pinyin.
出版與教育界普遍認為漢語拼音排版必須使用a與g為單層設計的、二聲調號下粗上細的字體。但其實未有任何國家標準對漢語拼音的字體及字母形態作出過具體規定。

The General Association of Chinese Culture in Taiwan once wrote to the Ministry of Education in Mainland China about the rules for the glyphs of Hanyu Pinyin, and received the response that the glyphs of the letter ‘a’ and ‘g’ correspond to those of Latin. There is no requirement demanding the handwritten glyphs.
台灣「中華文化總會」曾去信大陸教育部詢問漢語拼音字形相關事宜,部門回應表示,漢語拼音字母a、g對應相應的拉丁字母,呈現方式不需拘泥於手寫字形。

간단히 말해서 A, G의 소문자를 반드시 2번 같은 글꼴로 출력해야 한다는 규정(과 2성 부호(´)는 아래쪽이 굵어야 하고 위쪽이 가늘어야 한다는 규정)은 존재한 적조차 없는데, 출판계나 교육계에서 그런 규정이 있다고 착각하고 있었던 것뿐이다. 그나마 말이 되는 이유를 굳이 생각해 보자면, 중국 어린이들이 유치원 등에서 한어병음을 처음 배울 때 헷갈릴까 봐서 어린이용 출판물에서 2번처럼 쓰기 시작했는데, 누군가가 이것을 '의무 사항'이라고 착각했고, 이 착각이 퍼진 듯하다. 애초에 한어병음을 적을 때의 글꼴이나 글자 모양에 대한 규정 자체가 존재한 적이 없다.

또한 한어병음의 아버지라고 불리는 저우유광이 직접 한어병음에서 사용되는 올바른 글자 스타일은 영어에서 사용되는 것과 같다고 말했다는 증언(아카이브)도 존재한다.

A, G의 소문자를 반드시 2번처럼 써야 한다는 괴상한 도시전설 때문에 중국어 웹사이트에서 한어병음을 쓸 때 [math(\rm a)]와 [math(\rm g)]를 일부러 [math(\rm ɑ)](U+0251)와 [math(\rm ɡ)](U+0261)로 바꿔서 쓰는 경우가 있으니 중국어 웹사이트로부터 한어병음을 복붙할 때 주의할 것. 그리고 이것 때문에 검색을 할 때 1번의 [math(\rm a)](U+0061), [math(\rm g)](U+0067)로도 해 봐야 하고 2번의 [math(\rm ɑ)], [math(\rm ɡ)]로도 해 봐야 할 때가 있다.

참고로 유니코드에 일반적인 1번의 [math(\rm a)](U+0061), [math(\rm g)](U+0067)와는 별개로 2번의 [math(\rm ɑ)](U+0251), [math(\rm ɡ)](U+0261)가 따로 있는 이유는 국제음성기호(IPA) 때문이며, 한어병음과는 전혀 관련이 없다. IPA에서는 1번의 [math(\rm a)]와 2번의 [math(\rm ɑ)]가 서로 다른 용도로 사용되며(\math(rm a)]]는 전설 비원순 저모음을 나타내고 math(rm ɑ)는 후설 비원순 저모음을 나타낸다), 유성 연구개 파열음(math(rm ɡ))은 2번의 [math(rm ɡ)] 모양으로 적도록 규정하고 있다. 반면 한어병음은 1번의 [math(rm a)]와 2번의 [math(rm ɑ)]를 구별하지도 않는 데다가 글자 모양에 대한 규정 자체가 존재하지 않는다. 그리고 유니코드에서 1번의 [math(rm a)], [math(rm g)]의 대문자는 각각 A(U+0041), G(U+0047)이지만 2번의 [math(rm ɑ)], [math(rm ɡ)]의 (국제음성기호를 확장 로마자로서 사용하는 [[아프리카의 여러 언어들의 표기법에서 비롯된) 대문자는 각각 Ɑ(U+2C6D), Ɡ(U+A7AC)이다.

따라서 컴퓨터에서는 검색, 대문자 ↔ 소문자 변환 등 텍스트 처리를 위해서라도 그냥 [math(\rm a)], [math(\rm g)]를 사용하면 된다. 책에 나온 것처럼 보이게 하려면 Century Gothic 같은 한 겹
a, g
를 쓰는 로마자 글꼴로 나타내면 될 뿐이다.

대만 교육부의 웹 사전은 발음 표기로 주음부호, 주음부호 2식, 한어병음을 병기하고 있는데, 주음부호 2식에는 1번의 [math(\rm a)], [math(\rm g)]를, 한어병음에는 2번의 [math(\rm ɑ)], [math(\rm ɡ)]를 사용하고 있다(따라서 복붙 시 주의). 그리고 베이징어언대학(北京语言大学)에서 발간한 각종 중국어 학습 교재의 유럽 언어판(영어 등)에서도 영어(불어, 독어, 스페인어 등)에서는 1번 같은 글꼴을, 중국어 발음 표기에서는 2번 같은 글꼴을 사용하고 있다.

여담으로 A, G의 소문자를 반드시 2번의
ɑ, ɡ
로 써야 한다는 괴상한 도시전설은 한국에도 들어갔다.

7. 대체 기호

컴퓨터 입력 등 편의를 위해 diacritics 등을 다음과 같이 바꿔 쓰기도 한다.
  • 성조 부호를 생략하고 대신 음절 뒤에 성조 번호를 쓴다. 1~4성은 각각 1, 2, 3, 4를 음절 뒤에 쓴다. 경성은 음절 뒤에 0이나 5를 쓰거나 아무 숫자도 표기하지 않는다. 한자의 표준중국어 발음을 정리하여 전산화할 때에는 경성에 5를 쓰는 게 일반적이다.
    • 예를 들어 mā는 ma1로 쓰고, ma(·ma)는 ma0나 ma5 또는 ma로 쓰고, hǎo는 hao3로 쓴다(ha3o가 아니라). ha3o와 같이 쓰면 하나의 운모가 쪼개져서 읽기가 어려워진다.
      • 휴대폰용 IME의 로마자 키보드에는 확장 로마자가 들어간 경우가 많은데, 3성 부호가 붙은 글자는 IME에 안 들어간 경우가 많아서 채팅에서 다른 성조는 제대로 쓰고 3성이 들어간 글자만 hao3, haov 식으로 쓰는 경우도 보인다. 심하면 LG처럼 1성 부호가 붙은 글자도 IME에 없는 경우도 있다.
    • 얼화(兒化)를 나타내는 -r는 컴퓨터 입력에서 종종 앞 글자에 r을 덧붙인 형태가 아니라 경성인 er로 취급되곤 하는데,[57] 이를 위 규칙대로 쓸 경우 er0이나 er5로 쓴다. 그래서 nǎr의 경우 na3er0이나 na3er5로 기재되기도 한다. 또는 儿/兒이 원래 2성이기 때문에 몇몇 입력기는 er2로 처리하기도(또는 er2을 허용하기도) 한다.
    • 전산에서는 잘 안 쓰이지만 종종 경성을 성절음인 문자 위에 점을 찍는 비표준 표기도 종종 쓰인다. 이런 표기에서는 I/i에 점을 찍어야 하는 경우 대문자 I는 İ[58]로, 소문자 i는 ı̇̇ 식으로 점 위에 또 점을 찍는 건 이상하므로 이것만은 그냥 i로 남겨 놓고 별도의 성조 표기를 안 하는 경우가 많다. 어차피 경성은 아무 기호를 안 쓰는 게 원칙인데 이 표기 방식은 일부러 경성임을 명확히 하려고 경성용 기호를 추가한 것이기에 그냥 i 한 경우만 원래 표기인 i 그대로 기재해도 1~4성과 구분하는 데에 지장이 없다. 참고로 이런 표기 방식에서는 이론상 추가 문자로 ê̇ ṁ ṅ ṅg (ŋ̇) ü̇ (v̇)와 Ê̇ İ Ṁ Ṅ ṄG (Ŋ̇) Ü̇ (V̇) 같은 문자 조합이 필요할 것이다.
  • ü의 움라우트는 성조 생략 시에도 쓰도록 돼 있어서 불편을 초래하고 있다. 그래서 대체 문자를 쓰는 경우가 많다.
    • 컴퓨터의 중국어 입력기에서는 표준중국어의 한어병음에서 v가 쓰이지 않기 때문에 주로 ü를 v로 입력하도록 한다. 그러나 중국어를 가르칠 때 이걸 안 가르쳐 줘서 중국어를 입력할 때 헤매는 사람들이 있다. [59]
      • 예를 들어 lǜ는 lv4레벨4로 쓰는 식이다. 단 ju, qu, xu, yu처럼 ü가 편의상 u로 기재되는 경우는 v가 아니라 본래 쓰던 철자 그대로 u로 쓴다.
        • 여기서 유추해서 üe는 ve로 바꾸는 게 원칙이다. lüe는 lve, nüe는 nve 식으로. 그런데 어차피 표준중국어를 한어병음으로 쓸 때 l이나 n 다음에 ue라는 문자 조합이 따라오는 경우는 없기 때문에, 컴퓨터의 중국어 입력기에서 lüe를 lue로, nüe를 nue로 입력하는 것 역시 허용하는 경우가 꽤 있다. 다만 이 경우 앞 음절이 ü로 끝나고 그 다음 음절에서 e로 시작하는 경우 알아서 사이에 '을 잘 입력해 줘야 한다. 다만 입력기에 따라서는 '가 들어갔을 때와 안 들어갔을 때를 모두 고려하여 가능한 한자 표기들을 모두 변환 후보 창에 띄우는 경우도 있기 때문에, ue가 입력이 들어왔을 때 üe인 경우와 u'e인 경우 모두를 한자 후보 창에 띄우는 경우가 있을 수도 있다.
    • 다른 방식으로 ü가 쓰일 자리에 yu로 고정시키는 표기법도 있다. lyu, lyue, nyu, nyue 식으로. ü 대신 v를 쓰는 게 기계적으로 쓸 때는 유리하지만 v를 모음으로 쓰는 게 영 익숙해지지가 않아서 yu를 쓰는 것이다. 이것은 통용병음과 비슷하다.
      • 중국 여권에서 2012년 8월부터 이 규칙을 적용한다(중국 여권의 표기 방식에 대해서는 뒤에서 구체적으로 서술한다). 吕(Lǚ) 씨나 律(lǜ)가 Lü나 Lv나 Lu 등이 아니라 LYU로 적히는 식이다.
      • 하지만 이런 표기 방식을 전면적으로 적용할 경우 어깻점(') 찍는 규칙을 바꿔야 해서 불편이 따른다(그래서 한어병음은 성모가 있을 때 yu 대신 ü를 사용하도록 한 것이고, 한어병음으로 중국어를 입력하는 IME에서는 ü 대신 v를 입력하는 방식이 더 선호된다고 볼 수 있다). 예를 들면 妓女(jìnǚ)와 金魚(jīnyú)의 경우, ü를 yu로 대체하면 jinyu로 똑같아지는데 전자를 ji'nyu로 적게 할 것인가 후자를 jin'yu로 적게 할 것인가 하는 문제가 대두된다.(전자를 ji'nyu로 적게 하는 게 후자의 기존 표기를 수정하지 않아도 되는 장점이 있어서 이쪽이 더 나을 듯하지만, 이렇게 하면 어깻점이 자음 앞에 등장하는 예외가 발생한다.)
    • 귀찮을 땐 ü를 그냥 u로 적어버리는 비표준 표기도 종종 보인다. 이 경우 원래 u였던 경우와 구분할 수 없게 되니 정확한 발음을 보존하고자 할 때에는 피해야 한다.
    • 어차피 한어병음은 읽는 방법을 따로 익혀야 하므로 한어병음 제정 당시(1950년대)에 ü 대신 v를 사용하도록 하고, v를 ㄩ(IPA [y])로 발음해야 한다는 걸 따로 익혀야 한다고 주장하는 것도 가능했을 것이다[60]. 반드시 ü를 채택해야 할 필요가 있었는지, 약간 아쉬움이 남는 부분이라고 할 수 있다. 물론 지금 와서 중국이 굳이 이 부분을 개정하지는 않을 것이다. 한어병음이 이미 너무 광범위하게 쓰이고 있기 때문이다. 한어병음은 이미 ISO 표준으로까지 채택됐다.
    • 중국의 한 도로 표지판에서 女를 nv로 '표기한' 사례(아카이브)가 있다. 한어병음 '입력'은 nv로 해도 한어병음 '표기'(성조 부호는 생략)는 nü로 해야 한다.[61] 현지 공무원이 규정을 잘 몰랐던 것 같다.
  • 감탄사·의성어·의태어로만 쓰이는 음절인 ê(欸), hm(噷), hng(哼) 등의 경우 한어병음 입력기에서 이 발음들을 지원하지 않는 경우가 많으므로 게다가 ê는 글자 자체를 입력할 수가 없다 해당 글자의 다른 음으로 입력하면 된다. 즉 각각 ai, hen, heng으로 입력하는 식. 단 yo(喲), lo(咯) 등의 다른 감탄사·경성 전용 음절 조합은 입력기에서 철자 변형 없이 그대로 입력하면 된다.

7.1. 중국 여권의 표기 방식

중국은 자국 여권을 발급할 때 무조건 한어병음을 (소수민족들의 경우는 음차한 다음에) 적용하나, 약간 변칙적인 표기 방식을 사용한다. 모든 글자를 대문자로 표기하고, 성조 부호와 어깻점(')은 생략하며, ü는 YU로 대체한다. 또한 쌍성의 하이픈(-)도 생략한다.
  • 예:
    • 周建军 (Zhōu Jiànjūn) → ZHOU, JIANJUN
    • 吕正安 (Lǚ Zhèng'ān) → LYU, ZHENGAN
    • 刘杨帆 (Liú-Yáng Fān) → LIUYANG, FAN

즉 A~Z 이외의 문자는 일절 사용하지 않는다고 보면 된다.

예전에는 ü의 처리 방법에 대해 별다른 표준이 없어서 여권 발급 기관에 따라 U를 사용하기도 했고 V를 사용하기도 했으나, 2012년 8월에 ü를 YU로 통일해 표기하기로 결정했다. 다만 기존 여권에 U 또는 V로 표기된 경우 그 표기를 그대로 유지하는 것은 가능한 모양이다. 예를 들어 베이징 궈안의 축구 선수 뤼펑(吕鹏)이 LV를 쓴다.

어깻점을 넣지 않기 때문에 두 음절 Yu'an(玉安)과 한 음절 Yuan(媛)은 모두 여권에 YUAN으로 표기되고, Zheng'an(正安)과 Zhengan(镇干)은 모두 여권에 ZHENGAN으로 표기된다.

8. 유니코드

유니코드에서 한어병음 문자들은 다음 코드 포인트들에 배당돼 있다. (연한 갈색 배경()은 한어병음과 상관없는 문자가 배당된 코드 포인트를 나타낸다.)
<colbgcolor=#eee,#191919> U+ 0 1 2 3 4 5 6 7 8 9 A B C D E F
002 ! " # $ % & ' ( ) * + , - . /
003 0 1 2 3 4 5 6 7 8 9 : ; ?
004 @ A B C D E F G H I J K L M N O
005 P Q R S T U V W X Y Z [ \\ ] ^ _
006 ` a b c d e f g h i j k l m n o
007 p q r s t u v w x y z { | } ~
00B ·
00C À Á È É Ê Ì Í
00D Ò Ó Ù Ú Ü
00E à á è é ê ì í
00F ò ó ù ú ü
010 Ā ā Ĉ ĉ
011 Ē ē Ě ě
012 Ī ī
014 Ń ń Ň ň Ŋ ŋ Ō ō
015 Ŝ ŝ
016 Ū ū
01C Ǎ ǎ Ǐ
01D ǐ Ǒ ǒ Ǔ ǔ Ǖ ǖ Ǘ ǘ Ǚ ǚ Ǜ ǜ
01F Ǹ ǹ
030 ◌̀ ◌́ ◌̄ ◌̌
1E3 ḿ
1E9
1EB ế
1EC

다음 문자들은 유니코드에 한 코드 포인트로 등록돼 있지 않으므로 combining diacritics를 써서 나타내야 한다. 물론 다 특별한 경우에만 쓰이는 문자들이므로 쓸 일은 거의 없을 것이다.
  • Ê̄: U+00CA Ê + U+0304 ◌̄
  • ê̄: U+00EA ê + U+0304 ◌̄
  • Ê̌: U+00CA Ê + U+030C ◌̌
  • ê̌: U+00EA ê + U+030C ◌̌
  • : U+004D M + U+0304 ◌̄
  • : U+006D m + U+0304 ◌̄
  • : U+004D M + U+030C ◌̌
  • : U+006D m + U+030C ◌̌
  • : U+004D M + U+0300 ◌̀
  • : U+006D m + U+0300 ◌̀
  • : U+004E N + U+0304 ◌̄
  • : U+006E n + U+0304 ◌̄
  • Ŋ̄: U+014A Ŋ + U+0304 ◌̄
  • ŋ̄: U+014B ŋ + U+0304 ◌̄
  • Ŋ́: U+014A Ŋ + U+0301 ◌́
  • ŋ́: U+014B ŋ + U+0301 ◌́
  • Ŋ̌: U+014A Ŋ + U+030C ◌̌
  • ŋ̌: U+014B ŋ + U+030C ◌̌
  • Ŋ̀: U+014A Ŋ + U+0300 ◌̀
  • ŋ̀: U+014B ŋ + U+0300 ◌̀

유니코드 이전에 일반적으로 쓰이던 간체 중국어 문자 코드 GB 2312에는 한어병음 표기용으로 diacritic 붙은 글자들이 (정확히는 성조 부호 없는 ü와 a, e, i, o, u, ü에 성조 부호 붙은 글자들, 그리고 ê만 있다. 확장형인 GB 5007.1이나 GB 6345.1 등에는 ḿ, ń, ň, ǹ도 있다.) 포함돼 있는데, 소문자만 있고 대문자는 없다. 그래서 유니코드 이전의 GB 2312 기반 환경에서는 성씨 Áo(敖)나 Zhōu Ēnlái (周恩来) 같은 고유 명사들의 한어병음 표기를 제대로 적을 수 없었다.

9. 미국 의회도서관

미국 의회도서관 중국어 로마자 표기법

미국 의회도서관(Library of Congress, LC)도 한어병음으로 중국어로 된 서적 제목들을 로마자로 표기하고 있다. 다만 한어병음방안과는 달리 각 음절을 띄어 쓰는 것이 원칙인데, 이건 LC가 웨이드-자일스 표기법을 쓰던 시절의 잔재가 남은 것이다. LC가 웨이드-자일스 표기법을 쓰던 시절에는 각 음절을 띄어 썼고, 고유 명사의 각 음절들 사이에는 하이픈(-)을 넣어 썼다. LC는 2000년에 한어병음을 따르기로 결정했는데, 이때 웨이드-자일스 표기법으로 표기된 기존 기록들을 (음절 단위로) 한어병음으로 변환하면서 하이픈은 제거하고(즉 그냥 붙여 씀) 공백은 그대로 두었다. 기존 기록들의 띄어쓰기를 단어 단위에 따라 하도록 자동 변환하는 것은 불가능하기 때문이다. 그래서 현재도 로마자 철자는 한어병음방안에 따르나 띄어쓰기는 기본적으로 음절 단위로 하는 원칙을 유지하고 있다.

그래서 언제 붙여 쓰는지에 대한 규정이 따로 있다(물론 붙여 썼을 때 a/e/o로 시작하는 음절이 다른 음절 바로 뒤에 오는 경우 한어병음방안과 마찬가지로 어깻점을 넣는다). 성조는 아예 표기하지 않는다. 대·소문자, 문장 부호, 날짜 표기 등에 대한 규정도 있다.

참고로 매큔-라이샤워 표기법은 한어병음과는 반대로 -ㅇㅇ-은 그냥 ng로 적고 -ㄴㄱ-은 n'g로 적는데(예: 항아리 hangari, 한글 han'gŭl), 이것의 영향인지 과거에 미국 의회도서관은 한어병음을 도입할 때 n과 g 사이에 어깻점을 찍는다고 착각했던 적이 있었다(그리고 이게 틀렸다는 지적이 나와서 나중에 제대로 고쳐졌다). 이건 이러한 착각을 일으키게 한 표기법 중 하나인 매큔-라이샤워 표기법은 digraph가 아닌 경우에 부호를 사용하도록 해서 그렇고, 한어병음은 어차피 -ng- 외에도 어깻점이 필요한 경우가 있으니까 그런 것이다. 매큔-라이샤워 표기법은 ㅐ, ㅚ, 받침 ㅇ에 각각 ae, oe, ng라는 digraph를 배당했고, digraph가 아니라 a+e, o+e, n+g인 경우에는 부호를 사용하도록 했다(ㅏ에 aë, ㅗ에 oë, ㄴㄱ n'g). 그래서 매큔-라이샤워 표기법에서는 -ㅇㅇ-은 그냥 ng로 표기하고 -ㄴㄱ-은 n'g로 표기하게 된 것이다. 반면 한어병음은 어차피 pi'ao처럼 -ng-와 무관한 경우에도 a, e, o 앞에 어깻점이 필요한 경우가 있으니까 fang+an과 같이 ng와 a/e/o 사이에 음절 경계가 있는 경우에는 pi'ao 등과의 통일성을 위해서 fang'an으로, fan+gan과 같이 n과 g 사이에 음절 경계가 있는 경우에는 그냥 fangan으로 표기하게 한 것이다. 즉 각 표기법 내부에서는 일관성이 있는 셈이다.

10. 성조 번호 → 성조 부호 변환 도구

아래 도구들은 각 음절의 끝에 붙은 성조 번호를 성조 부호로 변환해 주는 도구들이다. 성조 부호가 붙은 글자들을 일일이 입력하기 번거로울 때 아주 편리할 것이다. 예를 들어 Zhong1wen2이라고 입력하면 Zhōngwén으로 변환해 준다.

성조 번호를 성조 부호로 변환해 주는 도구들이 아래에 있는 것들 말고도 더 있기는 한데, 대문자를 입력해도 결과물이 죄다 소문자로 나오거나, ü를 직접 입력해야 하거나, 대문자 위에 성조 부호를 붙이지 못하거나, 3성 부호를 뾰족한 caron이 아니라 둥그런 breve로 잘못 출력하거나 하는 문제들이 있다. 아래에 있는 것들이 가장 정확도와 완성도가 높다.

대부분의 경우 Pinyin Tone Tool과 Type Pīnyīn, PinyinTones로 충분하다. 경성임을 명확히 나타내고자 할 때 쓰는 가운뎃점(·), ê, ĉ, ŝ, ẑ, ŋ, ê/m/n 위에 성조 부호가 붙은 글자들이 필요한 특별한 경우에만 제한적으로 在線輸入法:漢語拼音을 사용하면 될 것이다.

각 도구마다 동작 방식이 약간씩 다르므로 주의할 필요가 있을 수도 있다.

10.1. 이미 입력되어 있는 Zhong1wen2을 Zhōngwén으로 변환해 주는 온라인 도구

  • Pinyin Tone Tool (가끔씩 일어나는 접속 장애를 대비한 아카이브) - JavaScript 기반이고 데이터가 서버로 전송되지 않으므로 아카이브 페이지에서도 문제없이 잘 돌아간다.
    • 성조 번호를 사용해 병음을 쓰고 Convert 버튼을 누르면 변환된다. Convert 버튼을 누르기 전까지는 변환이 일어나지 않기 때문에 다른 곳으로부터 복붙된 병음도 문제없이 변환된다. 대량의 텍스트를 일괄 변환하고자 할 때는 이 도구가 좋다.
    • 경성은 음절 뒤에 5를 입력하거나 아무 번호도 입력하지 않는다. 5는 변환 시에 단순히 사라지며, 가운뎃점은 추가되지 않는다.
    • fang1'an4 대신 어깻점 없이 fang1an4이라고 입력해도 알아서 어깻점을 집어넣어 준다(fang1'an4 또는 fang1an4 → fāng'àn).
      • 그래서 어깻점이 자동으로 추가되기를 원하는 경우, 성조 번호는 반드시 음절의 맨 끝에 입력해야 한다. a/e/o의 바로 앞에 성조 번호가 있을 때 어깻점을 집어넣는 구조이기 때문이다. 만약 fang1an4이 아니라 fa1nga4n으로 입력한다면 어깻점이 자동으로 추가되지 않고 fāngàn으로 변환된다.
    • 얼화 운미 뒤에 성조 번호를 붙여도 잘 변환해 준다(예: dian4yingr3 → diànyǐngr).
    • ü는 v로 입력해도 ü로 입력해도 변환된다. 만약 변환 후의 결과물에서 성조 부호 없는 ü만 따로 나오게 하고 싶은 경우 v5라고 치고 변환하면 된다.
    • 사소한 문제가 하나 있는데, 예전에 대만 국어에 존재했었던 음절 lüan에 성조 번호를 붙일 경우 성조 부호가 a가 아니라 ü 위에 붙는다(예: lvan3/lüan3 → lǚan. 올바른 표기는 lüǎn임). 다만 현재는 lüan이라는 음절 자체가 대만 국어에서도 사라졌으므로 중요한 문제는 아니다.
    • ê, ĉ, ŝ, ẑ, ŋ이나 ê/m/n 위에 성조 부호가 붙은 특수한 글자들은 지원하지 않는다.

10.2. 운모와 성조 번호를 직접 입력하면 성조 부호를 붙여 주는 도구

사용자가 직접 누르는 키 입력을 기준으로 변환하기 때문에 병음을 해당 창에 직접 입력해야 하며, 다른 곳에서 입력된 병음을 입력 창에 복붙하면 변환이 안 된다.

어깻점은 자동으로 추가되지 않는다. 그래서 fāng'àn을 입력하고 싶다면 반드시 fang1'an4과 같이 어깻점을 직접 입력해 줘야 한다.

10.2.1. 온라인 도구

  • Type Pīnyīn
    • 성조를 제외한 철자는 일단 다른 곳에서 입력한 뒤, Type Pīnyīn에 복붙하고 각 음절 뒤에 커서를 두고 성조 번호를 눌러 줘도 된다(예: Zhongwen을 다른 곳에서 입력한 뒤 복붙하고 Zhong 뒤에서 1을 누르고 wen 뒤에서 2를 누르면 Zhōngwén으로 바뀜). 다시 말해서 Type Pīnyīn에서 직접 눌러 줘야 하는 건 각 음절의 성조 번호뿐이다.
    • 在線輸入法:漢語拼音과는 달리 운모 입력 도중에 오타를 내거나 화살표 키 등을 누르더라도 해당 운모를 처음부터 다시 입력할 필요가 없다.
    • 특정 음절의 성조 부호를 바꾸고 싶다면(예: 성조 번호를 잘못 입력했거나 -ùi와 같이 성조 부호가 잘못된 위치에 붙어 있다면), 해당 음절의 바로 뒤에 커서를 둔 뒤 원하는 성조 번호를 누르면 된다. 예를 들어 hái를 hǎi로 바꾸고 싶다면 그 hái의 바로 뒤에 커서를 둔 뒤 3을 누르면 된다. zùi를 zuì로 바로잡고 싶다면 그 zùi의 바로 뒤에 커서를 둔 뒤 4를 누르면 zuì로 바로잡힌다.[62] 특정 음절의 성조 부호를 지우고 싶다면 해당 음절의 바로 뒤에 커서를 둔 뒤 5를 누르면 된다(가운뎃점은 추가되지 않는다).
    • 얼화 운미 뒤에 성조 번호를 입력해도 잘 변환된다(예: dian4yingr3 → diànyǐngr).[63]
    • ü는 v로 입력해도 ü로 입력해도 변환된다. v는 일단 v 그대로 입력되지만, 성조 번호가 입력되면 그 즉시 ü로 바뀐다. 그래서 성조 부호 없는 ü를 원하는 경우 v5라고 치면 된다.
    • ê, ĉ, ŝ, ẑ, ŋ이나 ê/m/n 위에 성조 부호가 붙은 특수한 글자들은 지원하지 않는다.
  • 在線輸入法:漢語拼音 (Online Keyboard: Pinyin)
    • Type Pīnyīn과는 달리 오타에 민감하며, 운모 + 성조 부호를 반드시 직접 입력해 줘야 한다(예: Zhōngwén의 경우 Zh와 w는 다른 곳에서 입력한 뒤 복붙해도 되나, ōng과 én은 각각 ong1과 en2을 직접 눌러 줘야 함). 운모 입력 도중에 오타를 내거나 화살표 키 등을 누르면 해당 운모를 처음부터 다시 입력해야 한다(중간부터 다시 입력할 경우 성조 번호가 성조 부호로 변환되지 않는다). 성조 번호를 잘못 입력한 경우에도 해당 운모를 처음부터 다시 입력해야 한다.[64]
    • 얼화 운미는 별도의 음절처럼 입력해야 한다. 그래서 diànyǐngr을 입력하고 싶다면 dian4yingr3이 아니라 dian4ying3r이라고 입력해야 한다.
    • ü는 v로만 입력해야 한다(v를 누르면 바로 ü가 입력된다. 굳이 v를 원하는 경우 v^를 눌러야 한다). 다만 음절 lüe, nüe의 경우 Pinyin Tone Tool과 Type Pīnyīn과는 달리 lue, nue로 입력해도 알아서 lüe, nüe로 바꿔 준다(물론 lve, nve로 입력해도 된다).
    • 가운뎃점은 ` 키(1 바로 왼쪽)를 누르면 된다.
    • ê, ĉ, ŝ, ẑ, ŋ도 입력할 수 있고(각각 e^, c^, s^, z^, n^으로 입력함), ê/m/n 위에 성조 부호도 붙일 수 있다.
    • 중대한 버그가 두 개 있으므로 주의할 필요가 있다.
      • u의 2성이 ú가 아니라 ū로 잘못 변환된다(다만 un은 문제가 없다). 대문자도 마찬가지다.
      • lue/nue → lüe/nüe 자동 교정 때문에 오히려 lu/nu 위에 성조 부호가 붙지 못하며, lun/nun 위에 성조 부호를 붙이려고 하면 luń/nuń과 같이 n 위에 성조 부호가 붙는다.

10.2.2. 오프라인 도구

위에 소개된 다른 도구들과는 달리 한 번 다운로드하면 인터넷 연결 없이 계속 사용할 수 있다.
  • PinyinTones
    • Microsoft Windows에서만 사용 가능하다.
    • 일본어 IME로 동작하기 때문에 입력을 다 하고 Enter 키를 눌러서 확정해 줘야 한다. Enter 키를 누르기 전에 Esc 키를 누르면 입력 중인 문자열이 다 날아가니 주의할 것. 그리고 확정된 문자열에 대해서는 성조 부호를 붙이거나 바꾸는 것이 불가능하므로, 성조 부호를 붙이거나 바꾸고 싶다면 해당 부분을 다시 입력해 줘야 한다.
    • Type Pīnyīn과 마찬가지로 특정 음절의 성조 부호를 바꾸고 싶은 경우, 해당 음절의 바로 뒤에 커서를 둔 뒤 원하는 성조 번호를 누르면 된다.[65] 얼화 운미 뒤에 성조 번호를 입력해도 잘 변환된다.[66]
    • 성조 부호는 커서가 어디에 있든 마지막 음절에만 적용된다는 문제점이 있다. 예를 들어 Zhongwen을 입력하고 Enter 키를 누르지 않은 상태에서 왼쪽 화살표 키를 세 번 눌러 g 뒤에 커서를 두고 성조 번호를 눌러도 성조 부호가 e 위에 추가되며, o 위에 추가되지 않는다. 그래서 Zhōngwén을 입력하려면 반드시 Zhong1wen2 순서로 눌러야 하며, Zhongwen → 왼쪽 화살표 키 세 번 → 1 → …과 같은 순서로 누르면 안 된다.
    • ü는 v로 입력한다.
    • ê, ĉ, ŝ, ẑ, ŋ이나 ê/m/n 위에 성조 부호가 붙은 특수한 글자들은 지원하지 않는다.
  • 한/글의 '중국어 간체 - 병음 (성조)' 자판
    • 한/글에서 문서 작성을 하는 경우는 Alt+F2를 누르고 '중국어 간체 - 병음 (성조)' 자판을 선택하면 된다. 모음 글자(a, e, i, o, u) 뒤에 성조 번호를 누르면 성조 부호가 추가된다. 예를 들어 māo는 ma1o 순서로 누르면 된다. ü(+ 성조 부호)를 입력하고 싶으면 u5(성조 부호 없는 ü)를 친 뒤 성조 번호(1, 2, 3, 4)를 누르거나(예: ǘ를 입력하려면 u52를 누름), 또는 u6(ǖ), u7(ǘ), u8(ǚ), u9(ǜ)를 누르면 된다. 왜 v를 놔 두고 이렇게 했는지는 알 수 없다. 하지만 이 덕에 v를 써야 할 경우가 있으면(가령 영어와 한어병음을 섞어 쓴다든가) 글자판을 전환하지 않아도 된다.
    • 다만 몇 가지 문제가 있다.
      • 모음 글자를 입력한 직후의 Space 키나 Enter 키는 무시된다. 예를 들어 hǎo ma를 입력하려면 ha3o [space] [space] ma로 눌러야 한다. 아무래도 Space나 Enter가 확정 키로 쓰이는 모양이다.
      • 대문자가 지원되지 않는다. 예를 들어 a1이 아니라 A1이라고 쳐도 그냥 ā가 입력되고 Ā가 입력되지 않는다. 대문자를 입력하려면 메뉴의 '편집 → 글자 바꾸기 → 대문자/소문자 바꾸기' 기능을 이용하거나 문자표를 이용해야 한다.
      • 마침표가 온점(.)이 아닌 고리점(。)으로 나온다. 한자로 쓸 때는 고리점을 쓰지만 한어병음으로 쓸 때는 온점을 써야 한다.

11. 한자 → 한어병음 변환 도구

구글 번역에 언어를 중국어로 맞추고 중국어 단어나 문장을 넣으면 아래에 한어병음이 자동으로 출력된다. 단어 단위로 분석하기 때문에(번역기라는 특성상 필연적으로 단어 단위로 분석해야 한다) 여러 음이 있는 한자도 단어에 따라 비교적 잘 변환하며(예: 都 dōu, 首都 shǒu; 進行 jìnxíng, 銀行 yínháng; 快樂 kuài, 音樂 yīnyuè), 띄어쓰기도 무식하게 음절마다 하지 않고 기본적으로 단어 단위로 한다. 다만 고유 명사의 첫 글자가 대문자로 출력되지 않는 문제가 있고(예: 中國 zhōngguó, 北京 běijīng),[67] 잘 알려진 인명조차 성씨와 이름 사이를 띄어 쓰지 않는 문제가 있고(예: 毛泽东 máozédōng, 习近平 xíjìnpíng), 얼화 운미를 그냥 별도의 경성 음절로 출력하는 문제가 있다(예: 哪兒 nǎ'er).

이런 도구이런 도구도 있기는 한데(둘은 사실상 같은 도구이다), 단어 단위 분석 없이 기계적으로 한자 단위로 병음으로 바꾼다(그래서 띄어쓰기도 무식하게 음절마다 한다). 그래서 아주 기초적인 단어 什麼조차도 shí me로 잘못 변환되고, 위에서 예로 든 首都도 shǒu dōu로, 進行도 jìn háng으로, 音樂도 yīn lè로 잘못 변환된다. 어차피 중국어도 한 한자에 여러 독음이 존재하는 경우가 여럿 있는 이상 한자 → 한어병음 변환은 무식하게 개별 한자 단위로 할 게 아니라 기본적으로 단어 사전으로 해결해야 한다. 심지어 내부 DB에도 문제가 있어서 军을 변환하면 jūn이 아니라 jun1이라고 나온다.

단어 사전을 만들기/마련하기 어렵다면, 여러 음이 있는 한자는 하나의 독음만 출력할 게 아니라 여러 음을 한꺼번에 출력하도록 하는 것이 좋을 것이다(예: 樂를 넣으면 lè/yuè가 출력되도록 함). 이렇게 하면 사용자는 필요한 독음만 남기고 필요 없는 독음은 지우면 된다.

12. Chinese Pinyin 글꼴 (위장술, 편법)

1997년에 하버드 대학교에서 중국어 학습 자료를 만들 때 사용한 일종의 직결식 글꼴Chinese Pinyin이라는 것이 있다. 이 글꼴은 ASCII 코드의 일부 문자들을 한어병음에 쓰이는 diacritic 붙은 문자들로 마개조해 놓은 것이다. 예를 들어서 숫자 5(U+0035)의 자리에 é를 그려 놓고, 5를 입력하면 é가 표시되게 겉모습만 '위장'하는 방식이다. 즉 보이기는 é로 보여도 내부적으로는 숫자 5로 저장되며, 다시 말해서 편법이다. 이 방법은 쓰지 말아야 한다. 물론 종이에 인쇄할 목적이라면 아무 상관은 없다.[68]

문제는 일부 중국어 교사들이 Chinese Pinyin 글꼴에 의존해서 학습 자료를 만들고 그걸 온라인에 올린다는 것이다. 예를 들어서 H3ny} P%ny%n이라는 문자열에 Chinese Pinyin 글꼴을 적용해서 Hànyǔ Pīnyīn으로 보이게 위장해 놓는다. 그러나 이 방법은 근본적으로 편법이기 때문에 여러 심각한 문제들이 존재한다.
  • Chinese Pinyin 글꼴이 없는 대부분의 환경에서는 온갖 기호들과 숫자들이 섞인 괴상한 텍스트로 표시되기 때문에 무슨 소리인지 알 수 없게 된다(사례: 1, 2, 3, 4, 5, 6, 7 등).
    • 학습 자료를 만든 교사조차도 다른 기기에서 한어병음이 괴상하게 나와서 곤란해지는 경우가 있다(사례).
    • 이 글과 같이 독자에게 Chinese Pinyin 글꼴을 설치할 것을 요구하는 경우도 있으나, iOS처럼 글꼴을 설치할 수 없는 환경도 있다. 이런 환경에서는 의도한 텍스트를 어떤 방법으로도 정상적으로 볼 수 없다.
  • 글꼴을 바꿀 수 없는 환경(글꼴이 프로그램 기본값으로 고정돼 있는 환경이나 글꼴을 하나만 지정할 수 있는 환경 등)에서는 제대로 쓸 수 없다. 글꼴이 프로그램 기본값으로 고정돼 있다면 글꼴을 Chinese Pinyin으로 바꿀 수 없으므로 위 위장술을 쓸 수 없으며, 반면 글꼴을 하나만 지정할 수 있는 환경에서 글꼴을 Chinese Pinyin으로 설정하면 진짜로 숫자나 기호 등을 쓰고자 할 때 해당 숫자나 기호가 정상적으로 출력되지 않는다.
  • 또한 이 위장술을 써서 입력한 텍스트는 검색도 안 된다. 예를 들어 Hànyǔ Pīnyīn이라는 문자열을 검색하면 Chinese Pinyin 글꼴을 적용해서 겉모습만 위장해 놓은 H3ny} P%ny%n이라는 문자열이 걸릴 리가 없다.

올바른 방법은 (현재 이 문서나 한어병음 정사법 기본 규칙 문서 등에 적은 한어병음 표기처럼) 처음부터 실제 유니코드 문자를 사용하는 것이다. 예를 들어서 é를 입력할 때는 처음부터 실제 유니코드 문자 é(U+00E9)를 써야 하며, 숫자 5(U+0035)에다가 Chinese Pinyin 글꼴을 적용해서 겉모습만 é로 보이게 '위장'해서는 안 된다. (그리고 실제 유니코드 문자를 출력해 주는 도구들은 위에 있다.)

12.1. Chinese Pinyin 변환표

깨진 문자 원래 문자
! Á
# À
$ Ē
% ī
& ǐ
* ì
+ ǘ
- ò
0 ǒ
1 á
2 ǎ
3 à
4 ē
5 é
6 ě
7 è
8 ō
9 ó
= ǖ
@ Ǎ
[ ū
\\ ǜ
] ù
^ í
_ ü
` ā
{ ú
| ǚ
} ǔ
~ Ā

이 표는 Chinese Pinyin 기준이며 대문자 버전인 Chinese Pinyin Cap은 이 표에서 소문자로 표기된 부분이 전부 대문자 모양으로 되어 있다.


[1] 닫는 작은따옴표처럼 생긴 어깻점(apostrophe). 유니코드 문자 U+2019 RIGHT SINGLE QUOTATION MARK이다. 다만 중국어 글꼴에서는 이 문자의 폭이 보통 전각으로 돼 있기 때문에 공백 없이 fāng’àn이라고 입력해도 마치 fāng’ àn처럼 ’ 바로 뒤에 공백이 있는 것처럼 보이게 된다.[2] IT 기기에서 자주 쓰이는 열지도 않고 닫지도 않는 작은 따옴표와 동일한 어깻점이다. (단 폰트에 따라서는 이 문자를 닫는 작은 따옴표와 동일한 형태로 렌더링하기도 한다.) 유니코드 문자 U+0027 APOSTROPHE. 이 문자는 미국 표준 QWERTY 등의 기본 자판 배열에 포함됐지만, 따옴표·어깻점의 형태를 자동 변경하는 Microsoft Word 등에서 이 문자를 직접 입력해야 할 경우를 대비해 복사용 문자로 기재한다. 물론 MS Word에서도 '를 키보드로 직접 입력할 방법이 있긴 하지만, 설정에 들어가서 따옴표·어깻점 자동 변경을 끈다거나 해야 하므로 직접 입력하기는 불편하다. 그냥 이미 다른 곳에 입력된 '을 복사해서 붙여 넣어야 편하다.[3] 한어병음 정사법 기본 규칙의 변용 규칙(變通規則)을 따라 경성(輕聲)을 음절 앞에 가운뎃점(일반적으로 쓰는 가운뎃점)을 덧붙여 표기하기도 한다.[4] 언어학자라고는 했지만 학위는 경제학으로 땄다. 한어병음 개발할 때까지 푸단대학 경제학 교수였다. 그러나 그는 경제학자이면서도 언어에 조예가 깊었고, 이러한 경험 덕분에 중국 정부에게 한어병음 개발 의뢰를 받을 수 있었다. 그는 111세 생일을 맞이한 지 딱 하루 만에 세상을 떠났으며 국제노인학 그룹 수퍼센티네리언 명단에도 등재되었다. 그의 아들 저우샤오핑(周曉平 1934~2015)은 2015년에 80살 나이로 먼저 세상을 떠났다.[5] 간단히 말하면 현급 행정구역과 현의 이름과 동일한 현할시 이름과, 직할시는 영문 표기와 성조와 특수 기호만 제거한 웨이드식이 일치한다. 또 현 이름은 아니지만 마쭈(Matsu)도 마찬가지다. 예외는 신베이(New Taipei), 지룽(Keelung), 자이(Chiayi), 푸젠성의 진먼(Kinmen 또는 Quemoy)이다. 위의 원칙에서 말하는 '다른 규정이 있는 경우'이다.[6] 가령 베이징의 영문 표기는 원래 Peking(우정식 병음)이었으나 영문 표기도 한어병음방안 철자(Beijing)에 맞춰서 써줄 것을 각국에 요구했고 유엔에서도 이를 받아들였다. 다른 지명도 마찬가지. 다만 영어 이외의 로마자 사용 언어에서는 Beijing으로 쓰지 않을 때가 많다. (예: 프랑스어와 스페인어 Pekín, 독어 Peking, 카탈루냐어 Pequin, 포어 Pequim). 일본어가타카나로는 ペキン(페킹)이라고 표현한다. 그리고 역사가 긴 대학이나 상표의 영문 표기는 한어병음방안 표기를 따라가지 않는 곳이 꽤 많다(예: 베이징 대학 Peking University, 칭화 대학 Tsinghua University, 칭다오 맥주 Tsingtao Beer). 즉 중국 본토의 고유명사 영문 표기에서 한어병음방안을 그대로 쓰기로 추진한 것은 1970년대 말부터로 더 전에는 자국에서 발행한 영문 문서에서도 Beijing이 아닌 Peking을 썼다. 바꿔 말하면 마오쩌둥이 살아 있을 때 영문 표기는 Mao Tse-tung이었고, 죽어서야 Mao Zedong이 된 것이다.[7] 후자의 경우는 중국 본토의 관행상으로도 충분히 인정될 수 있는 표기라고 볼 수 있다.[8] 관화의 예일식 로마자 표기법(Yale Romanization of Mandarin)에서 해당 발음을 syung으로 쓰긴 한다.[9] 특히나 이니셜을 표시할 경우 웨일드-자일스 표기법으로 표기한 이름의 것을 사용할 경우 다소 엉뚱해진다.[juquxu] 성모가 j, q, x일 때 철자의 편의를 위해 ü를 u로 바꿔 적는다.[juquxu] [juquxu] [juquxu] [ㄭ] 일반적으로 쓰는 주음부호가 아니다. 한어병음으로 zhi, chi, shi, ri, zi, ci, si의 i 부분에 해당하는 발음을 의미한다. 기기에 따라서는 이 문자가 안 보일 수도 있는데 한자 帀과 모양이 같은 문자이다.[15] 의외로 ㄦ의 실제 발음은 '얼'보다는 '알'에 가까운 경우가 더 일반적이다. 다만 음운 체계상 '얼'이라고 보는 것.[16] 본래 중화민국 국어(궈위)에 이 발음이 보존돼 있지만, 중화인민공화국에서 국어를 수정한 보통화(푸퉁화)에서 이 발음이 -ia/ya로 대체되었다. 따라서 한어병음방안 원문에는 iai가 없지만, 국어의 해당 발음을 유추하여 표기할 때 -iai/yai로 적는다. 그리고 이제 중화민국도 한어병음을 채택했으니 -iai/yai가 사실상 쓰이고 있다.[juquxu] [juquxu] [juquxu] [juquxu] [21] 체계상으로는 운복 ㄚa + 모음 운미 ㄨu이므로 au여야 하겠으나, 한어병음방안 제정자들은 이것을 au가 아닌 ao로 정했다. 이는 필기에서의 혼란을 방지하기 위함인데, 예를 들어 au를 악필로 흘려서 쓰면 ɑи처럼 되기 때문에 이것이 au인지 an인지 헷갈리므로 au를 ao로 정한 것이다. 다만 헷갈릴 염려가 별로 없는 곳에는 u를 충실히 표기하였다. 예를 들어 sun을 막 적어서 sии처럼 해놨어도 이걸 보고 sun인 걸 알 수가 있다. 왜냐면 sии에서 나올 수 있는 경우의 수 sun, suu, snn, snu 중 표준중국어에서 있을 수 있는 음절은 sun뿐이기 때문이다. 근데 liи처럼 쓰면 lin인지 liu인지 헷갈릴 수 있음이 함정. 이런 때는 성조를 정확히 기재하면 안 헷갈린다. lin은 i 위에, liu는 u 위에 성조 부호가 붙기 때문이다. 물론 성조를 생략했다면 똑바로 쓰지 않으면 헷갈리겠지만.[ㄡ] 체계상으로는 운복 e + 모음 운미 u이므로 eu이나, 이 발음은 ㄜe(어) + ㄨu(우)가 아닌 ㄛo(오) + ㄨu(우)로 해석된다. ㄨu(우)의 원순성 때문에 ㄜe(어)가 ㄛo(오)로 바뀐 것이다. 다만 외래어 표기법에서는 이 발음을 '오우'가 아니라 '어우'로 표기하니 주의할 것.[23] 단 ㄜe가 아닌 ㄝê가 붙는다. ㄧi(이)의 전설성 때문에 ㄜe(어)가 ㄝê(에)로 바뀐 것.[24] 단 ㄜe가 아닌 ㄛo가 붙는다. ㄨu(우)의 원순성 때문에 ㄜe(어)가 ㄛo(오)로 바뀐 것. 참고로 두 주음부호도 일부러 이런 연계성을 고려했기 때문에 두 글자를 비슷하게 만들었다.[25] 단 ㄜe가 아닌 ㄝê가 붙는다. ㄩü(위)의 전설성 때문에 ㄜe(어)가 ㄝê(에)로 바뀐 것.[26] 후술하겠지만 중화민국 국어에서만 인정된다.[27] 체계상으로는 운두 i + 운복 a + 모음 운미 u이므로 iau이다. 그러나 iau를 흘려 쓰면 iɑи이 되어 iau인지 ian인지 헷갈릴 수 있기에 iao로 쓴 것.[28] 체계상으로는 운두 i + 운복 e + 모음 운미 u이므로 ieu이다. 그러나 ㄨu(우)의 원순성 때문에 ㄜe(어)가 ㄛo(오)로 바뀐 것.[29] 체계상으로는 운두 i + 운복 e + 자음 운미 n이므로 ien이다. e의 생략에 관해서는 후술.[30] 체계상으로는 운두 i + 운복 e + 자음 운미 ng이므로 ieng이다. e의 생략에 관해서는 후술.[31] 체계상으로는 운두 ü + 운복 e + 자음 운미 n이므로 üen이다. e의 생략에 관해서는 후술.[32] 체계상으로는 운두 ü + 운복 e + 자음 운미 ng이므로 üeng이다. 이게 iong이 되는 이유는 후술.[ㄡ] [yu] ü가 성모 없이 어두에 온다면 일단 y를 앞에 첨가한 이후, ü에 있는 움라우트를 표기에서 빼기에 yu로 표기되므로.[yu] [36] 한어병음방안 원문에서는 ㄩㄥiong을 ㄧi와 ㄨㄥong의 결합으로 본다.[37] 이런 기기에서는 해당 글자의 다른 독음, 欸라면 ai라고 하는 식으로 우회해야 한다.[38] ㄏ 뒤에 쓴 글자는 兀 자와 생김새가 같은 확장 주음부호인데 기기에 따라서는 보이지 않을 수 있다. 이 기호는 한자 兀에서 유래한 것으로, ng 발음을 나타낸다. 주로 방언의 성모를 표기할 때 쓰지만 이런 식으로 모음이 없이 성절 자음이 된 경우 등에서 쓰기도 한다.[39] 그러나 ü에 1성 부호가 붙은 글자 ǖ는 실제로 쓰이지 않는다. 성모가 차탁음 자음인 음절에서는 성조가 1성인 경우가 드물기 때문이다. 한어병음에서 ü라는 글자가 필요한 경우는 l이나 n 뒤뿐인데, l과 n은 모두 차탁음이다. 그러다 보니 한어병음으로 lǖ, nǖ로 적히는 음절은 존재하지 않는다. 그리고 lüe, nüe는 어차피 성조 부호가 e 위에 붙는다(예: 略 lüè, 虐 nüè). 실제로 한어병음에서 ǖ라는 글자가 쓰이지 않음을 지적하는 (아카이브)도 있다. 그렇게 따지면 한국어에서도 한글 11172자가 다 쓰이는 것이 아니다.[40] 주음부호로 한자 한 글자의 발음을 표기할 때 운모를 2글자 쓰는 경우 첫 번째 글자는 반드시 ㄧ, ㄨ, ㄩ 중 하나이다. 한어병음의 성조 표기에서는 ㄧ, ㄨ, ㄩ(=개운모)에 해당하는 부분에 표기의 우선권이 없다고 생각하면 된다. 그리고 우선권이 있는 부분에 모음 글자가 둘 있으면 무조건 앞쪽에 찍는다고 생각하면 된다. ㄌㄧㄠ에 해당하는 한어병음 liao에서 성조를 표기할 때는 ㄧ에 해당하는 i가 아닌 ㄠ에 해당하는 ao가 표기 우선권을 갖고, 그 중 처음 나오는 모음 글자인 a에 한다는 말이다. ㄧㄡ와 ㄨㄟ 앞에 성모가 있는 경우를 본다면 ㄧ 부분이 아닌 ㄡ 부분에 성조 표기의 우선권이 있는데 ou에서 o가 생략되므로 성조 부호가 들어갈 자리는 u밖에 없는 거다. 마찬가지로 ㄟ에 성조 표기의 우선권이 있는데 ei에서 e가 생략되므로 성조 부호가 들어갈 자리는 i밖에 없다. 주음부호를 사용하지 않으니까 u와 i가 함께 있으면 뒤에 찍는다 그렇게 외울 수밖에 없는 거다. 다만 iong/ㄩㄥ은 한어병음과 주음부호의 결합 과정이 달라서 이런 식으로 설명되지 않는다는 문제가 있긴 하다. 물론 이것도 i ㄩ ong ㄥ으로(철자 변형) 대응하면 설명할 수 있다.[41] 중국에서 출판하는 외국인을 위한 중국어 학습서의 기초 교재에서는 띄어쓰기를 하기도 한다.[42] 복성(复姓): 두 음절로 이루어진 하나의 성씨(서로 다른 두 성씨의 결합이 아님). 諸葛(Zhūgě), 歐陽(Ōuyáng), 上官(Shàngguān), 東方(Dōngfāng), 司徒(Sītú) 등이 이에 해당된다. 쌍성(雙姓): 서로 다른 두 성씨가 결합되어 만들어진 성씨. 赵李(Zhào-Lǐ), 劉楊(Liú-Yáng), 陳言(Chén-Yán) 등이 이에 해당된다(趙李는 趙(Zhào)와 李(Lǐ)라는 서로 다른 두 성씨의 결합으로 이루어진 것이고, 劉楊도 서로 다른 두 성씨 刘(Liú)와 杨(Yáng)의 결합으로, 陳言도 서로 다른 두 성씨 陳(Chén)과 言(Yán)의 결합으로 이루어진 것임). 東方岳(Dōngfāng-Yuè)나 項司徒(Xiàng-Sītú)와 같이 세 음절 이상의 쌍성도 있을 수 있다. 한국의 성씨에 비유해 보자면 복성은 남궁, 선우, 황보 등이고 쌍성은 부모 성 함께 쓰기 등이다. 다만 중화권에서는 부모 성 함께 쓰기를 하는 경우가 없는 건 아니지만, 그보다는 주로 기혼 여성이 본인의 원래 성 앞에 남편 성을 덧붙여 쓰는 경우가 많다. 서양의 관행을 참고한 것인데, 중국 대륙에서는 흔하지 않지만 간혹 있고, 대만, 싱가포르(한어병음보다는 웨이드-자일스 표기법대로 적는 경우가 많지만)이나 홍콩·마카오(광동어가 표준이라 한어병음으로 성명을 적는 경우는 드물지만) 등에서는 꽤 있다.[43] 이는 도로명으로서의 종로(鐘路)는 Jong-ro로, 자치구 이름으로서의 종로구(鐘路區)는 Jongno-gu로 쓰는 현행 국어의 로마자 표기법과도 상통한다.[44] 다만 현행 한어병음 정사법(正詞法)은 유치원생이나 초등학교 저학년이 한자를 익히기 위해 제작된 간행물 등에서는 음절별로 띄어 쓰는 것도 변용 규칙(變通規則)으로 허용하기는 한다. 중국의 초등학교 저학년 교과서는 본문 한자 위에 한어병음을 다는데, (정사법에 허용 규칙이 있기도 하니) 보통 음절별로 띄어쓰기를 한다. 물론 이런 특별한 경우 외에는 음절 단위로 띄어 쓰지 않아야 맞는다.[45] 현대 중국어가 단음절 언어라는 오해는 꽤 흔하다. 하지만 시씨식사사처럼 되지 않으려면 단음절로는 곤란할 수 밖에 없다. 현대 중국어에 괜히 字典과 별개로 詞典이 있는 게 아니고, 괜히 連綿詞(聯綿詞라고도 함)라는 용어가 존재하는 게 아니다. 사실 이미 한문 시절부터 蝴蝶, 珊瑚 등 다음절 단어가 있었다.[46] 표준 중국어의 한어병음은 v를 쓰지 않지만 다른 중국어 방언을 옮겨 적기 위해 한어병음방안에는 v가 규정되어 있다.[47] ㄝ 바로 앞의 주음부호(ㄪ)가 출력되지 않을 경우를 위한 대체 표기는 万ㄝ. ㄪ(万)은 [ʋ\] 또는 [v\] 발음을 나타내는 옛 주음부호이다. 관화의 보수적인 하위 방언 중에 이 성모를 포함하는 경우가 있어서 중화민국 북양정부의 인위적인 표준어 발음이었던 노국음(老國音)에서 해당 성모를 인정하여 대응되는 주음부호를 만들었다. 이후 표준이 된 표준 중국어 발음에서는 해당 성모가 삭제되었다. 그래서 사람들이 주음부호 ㄪ(万)의 존재를 잘 모르기 때문인지 온라인에 돌아다니는 버전 중에는 모양이 비슷한 ㄞㄝ(ai+ê)로 잘못 입력된 것도 있다.[48] 1980년대 중국국제방송의 중국어 강좌에서는 가르쳐 줬다.[49] 풀어 말하면 b를 '비'라고 읽는 것이 77.2%, '보'라고 읽는 것이 14.1%, '베'로 읽는 사람은 없다는 말이다.[50] 물론 七(qī)처럼 다른 방식의 변천에 해당하는 케이스도 있다. 七 자가 한국어에서 '칠'로 읽히는 것에서 확인할 수 있듯이 이 글자의 경우 원래 성모가 k가 아닌 c였던 경우이다. 하지만 한어병음은 어원을 반영하는 표기법이 아니므로 그냥 qī로 적는다.[51] 설면음의 어원을 반영해 표기하는 중국어 로마자 표기법으로 1902년 프랑스 국립극동연구소에서 만든 원동박고원 병음방안이 있다.[52] 원래 x는 그리스어 Χ에서 기원한 글자로, 현대 그리스어 χ는 한국어 '흐름'의 ㅎ 비슷한 [x\] 발음이 나고, 국제음성기호의 [x\]도 같은 발음이 난다. 자세한 내용은 X 문서 참고.[53] 국제음성기호(IPA)로 적을 때 표기의 편의상 [ɲ\]으로 쓰는 경우가 많으나 사실 정확한 음가를 나타내는 기호가 아니라 보조 부호들을 덕지덕지 붙여야 정확한 표기가 된다. 한국어의 남한 지역 발음 기준으로 '니'를 발음하거나 표준 일본어 발음 기준으로 'に(ni)'를 발음할 때 ㄴ이 구개음화되는데 이 구개음화된 ㄴ 발음에 대응된다. 중국어학자들 중에는 비표준 IPA인 [ȵ\]로 적는 학자도 있다.[54] 중국어(관화가 아닌 방언 포함)의 각종 로마자 표기법에서 어말에서는 h가 쓰일 일이 없으므로 입성 발음의 성문 폐쇄음을 나타내기 위해 사용되는 경우가 많다. 우정식 병음 표기에서도 자주 보인다.[55] 참고로 국어라마자는 성조에 따라 철자가 달라지는 표기법인데, 기본형 철자에 q를 음절 끝에 붙여서 입성임을 나타내게 하였다.[56] single story는 위 표의 2번과 같은 형태를 말한다. 1번과 같은 형태는 double story라고 한다. 이 이미지이 이미지도 참고할 것.[57] 주음부호에서는 이 관점을 채용해 얼화를 표기할 때 ㄦ을 원래의 앞 음절 뒤에 경성 음절로 표기한다. 가령 nǎr의 경우 ㄋㄚˇ ˙ㄦ로 표기한다.[58] 애초에 한어병음에서는 모든 글자를 대문자로 적는 경우가 아니면 음절 첫 글자로 쓰일 수 없는 I, U, Ü가 대문자로 적히는 일이 드물기 때문에 변종 표기에서 대문자 İ 같은 표기도 쓰일 일이 거의 없다.[59] 이론상 v̄ v́ v̌ v̀와 V̄ V́ V̌ V̀ 같은 대체 표기의 존재 가능성을 생각해 볼 수 있겠으나(앞서 설명한 문자 위에 점을 찍어 경성임을 나타내는 방식까지 고려할 경우 v̇, V̇도 추가) 사실상 쓰이는 경우는 없다고 보면 된다. 애초에 v를 ü로 돌려 쓰는 경우는 컴퓨터 입력의 편의를 위한 것이기 때문이므로, 잘 쓰이지 않는 v̄ v́ v̌ v̀와 V̄ V́ V̌ V̀ 같은 문자를 입력할 이유 자체가 없다.[60] 한어병음방안 원문에는 한어병음자모 v가 등장하며, 방언이나 소수민족 언어 등의 표기에 사용한다고 되어 있다.[61] 그리고 저렇게 Zhinvqiaodongheyan 식으로 다 붙여서 써도 안 된다. 织女桥东河沿의 띄어쓰기 및 대·소문자까지 포함한 올바른 한어병음 표기는 Zhīnǚ Qiáo dōng héyán이며, 도로 표지판 등에서 흔히 쓰이는 표기 방식(성조 부호 생략, 모든 단어의 첫 글자를 대문자로)을 따른다면 Zhinü Qiao Dong Heyan이다.[62] 구조를 보면, 성조 번호를 누르는 순간 내부적으로 현재 음절에 있던 성조 부호를 지운 뒤, 사용자가 누른 성조 번호에 해당되는 성조 부호를 붙이도록 되어 있다. 즉 hái + 3 → hǎi는 내부적으로는 hái → hai (기존의 성조 부호를 지움) → hǎi (3이 입력됐으므로 3성 부호를 붙임) 이런 식으로 처리된다. 기존의 성조 부호를 아예 지우는 구조이기 때문에 성조 부호가 잘못된 위치에 붙어 있어도 바로잡을 수 있는 것이다(zùi + 4 → zuì는 zùi의 바로 뒤에서 4를 누르는 순간 내부적으로 기존의 성조 부호를 지워서 zui로 만든 뒤, 4가 입력됐으므로 4성 부호를 (올바른 위치에) 붙여서 zuì로 만듦).[63] 사실 얼화 운미뿐만 아니라 pinzzzzz1 → pīnzzzzz와 같이 존재할 수 없는 조합까지도 잘 변환된다(…). 구조가 '(1) 성조 번호를 누르면 현재 커서가 있는 위치로부터 왼쪽으로 역탐색을 해 나감 → (2) 모음 글자(하나 또는 여러 개)를 찾음 → (3) 왼쪽으로 역탐색을 더 진행해서 모음이 아닌 글자를 찾음 (경계를 파악하기 위해서임. 더 앞에 있는 음절들이 영향을 받지 않도록) → (4) 2번에서 찾은 모음 글자(여러 개일 경우 그중 하나)에 성조 부호를 붙임'이기 때문에 그렇다.[64] 이럴 수밖에 없는 게, '현재 입력 중인 운모'에 대한 keystroke 정보를 버퍼(?)에 넣어 놓은 뒤 성조 번호가 들어오면 성조 부호를 붙이고 버퍼를 비우는 구조이기 때문이다. 운모 입력 도중에 오타를 내거나 화살표 키 등을 누르면 버퍼가 초기화되며(오타나 백스페이스 또는 화살표 키 등을 누른 것도 당연히 keystroke로 간주되므로), 따라서 해당 운모를 처음부터 다시 입력하는 수밖에 없다. 그리고 성조 부호가 붙는 순간 버퍼가 비워지므로, 성조 번호를 잘못 입력하면 해당 운모를 처음부터 다시 입력해야 하는 수밖에 없다. Type Pīnyīn과는 달리 역탐색을 하는 구조가 전혀 아니라서 이런 불편이 있다.[65] 다만 성조 부호를 지울 수 있는 방법은 따로 존재하지 않는다. 0이나 5를 누르면 숫자 0이나 5가 입력될 뿐이며, 성조 부호가 지워지지 않는다. 이건 어차피 해당 모음 글자를 다시 입력하면 되므로 중요한 문제는 아니다.[66] 이것 역시 얼화 운미뿐만 아니라 pinzzzzz1 → pīnzzzzz와 같이 존재할 수 없는 조합까지도 잘 변환된다(…).[67] 이걸 확인하기 위해서는 你去北京嗎?와 같이 고유 명사의 앞에 다른 말을 넣어 봐야 한다.[68] 한국의 상술한 직결식 글꼴도 완전히 동일한 문제를 가지고 있다.

13. 둘러보기

파일:漢.svg파일:漢_White.svg 한자
{{{#!wiki style="margin:0 -10px -5px; min-height:calc(1.5em + 5px); word-break:keep-all"
{{{#!folding [ 펼치기 · 닫기 ]
{{{#!wiki style="margin:-5px -1px -11px"
<colbgcolor=#eee,#333> 서체와 자형 갑골문 · 금문 · 전서 · 예서 · 해서 · 행서 · 초서 · 정자(표준자형) · 간체자(간체자 논쟁) · 신자체(목록 · 변화 규칙) · 본자 · 속자 · 약자 · 이체자 · 한중일 한자
성질과 분류 획(필순) · 구조 · 파자 · 육서 · 상형자 목록 · 훈음 · 부수 · 부수(중국) · 부수(설문해자)
표준화 상용한자 (한문 교육용 기초 한자 · 통용규범한자표 · 당용한자 · 일본의 상용한자 (목록) · 학년별한자배당표) · 한국어문회 한자검정시험 · 어문회 급수 · 대한검정회 한자급수자격시험 · 검정회 급수 · 한자한문지도사시험 · 인명용 한자표 · 광동어 정음 운동
주음·표음화·한자음 반절 · 주음부호 · 병음 (한어병음 · 월어병음) · 한글(동국정운) · 훈독 · 음독 · 속음 · 한국 한자음 · 중국 한자음 (문백이독 · 상고음 · 중고음 · 근고음 · 양안 간 독음) · 일본 한자음 · 베트남 한자음 · 다음자
옥편 자전 · 설문해자 · 강희자전 · 옥편 · 이아 · 운서 · 광운 · 절운 · 집운 · 오음편해 · 한어대사전 · 대한화사전 · 중문대사전 · 이체자자전 · 한한대사전
색인 부수별 · 음별 · 획수별
국가별 사용 한자문화권 · 한문 · 백화문 · 한국의 한자 사용 · 한자어(한국식 한자어 · 중국식 한자어 · 일본식 한자어 · 베트남식 한자어) · 언어간 동형이의 한자어(고유명사) · 언어간 이형동의 한자어 · 우리말 새김
파생 문자 한글 전 한국어 표기 (국자 · 이두 · 향찰 · 구결) · 방언자 · 주음부호 · 가나 (히라가나 · 가타카나 · 헨타이가나 · 만요가나) · 측천문자 · 쯔놈 · 고장자 ·거란 문자 · 여진 문자 · 서하 문자
입력 · 검색 한자/입력기 · 창힐수입법 (목록) · 오필자형수입법 · 대이수입법 · 사각호마검자법
전산화 KS X 1001 · KS X 1002 · KPS 9566 · GB 2312 · JIS X 0208 · Big5 / 유니코드: 한중일 통합 한자 · BMP(통합 한자 · 통합 한자 확장 A · 호환 한자) · SIP(통합 한자 확장 B~F) · TIP(통합 한자 확장 G) · 한자 모양 설명 문자
기타 고사성어 · 천자문 · 한시 · 어조사 · 음역 · 서예 · 올해의 사자성어 · 올해의 한자 · 국한문혼용체(논쟁) · 국한문병용체 · 한자 교육 (한문(교과) (2022 개정 교육과정/한문과) · 한자 교육 찬반 논쟁) · 중복 한자 · 벽자 · 통자 · 갖은자 · 한자오자 · 미상 한자 · 유령 문자 · 특이한 한자 · 닮은꼴 한자 · 국호 · 주기율표 · 음률 · 한자문화권 고유명사 표기 · 자주 틀리는 한자어 · 훈을 혼동하기 쉬운 한자 · 부수를 혼동하기 쉬운 한자 · 한자를 혼동하기 쉬운 단어 · 발음이 여럿인 한자어 · 한국의 성씨(인구분포 · 지역별) · 후리가나 · 창작 한자 }}}}}}}}}

한자문화권의 문자
{{{#!wiki style="margin:0 -10px -5px; min-height:calc(1.5em + 5px); word-break:keep-all"
{{{#!folding [ 펼치기 · 접기 ]
{{{#!wiki style="margin: -6px -1px -11px"
<rowcolor=#fff> 지역 현재 사용되는 문자 사라진 문자
대한민국 한글 구결 · 옛한글
한자 정자(정체자, 번체자)
약자(대한민국)
주음부호(대만) · 한어병음(대륙) · 통용병음(대만) · 대라병음(대만) · 객가어병음(대만)
월어병음(홍콩, 마카오)
한글 전 한국어 표기
대만 측천문자 · 거란 문자 · 서하 문자 · 여진 문자 · 만주 문자 · 우정식 병음 · 국어라마자 · 국어 주음부호 제2식 · 예일식 관화 병음 · 국어 주음부호 제2식 · 웨이드-자일스 표기법 · 예일식 광동어 병음
홍콩 · 마카오
중국 대륙 간체자 · 한어병음 · 몽골 문자(내몽골) · 고장자(광시) · 신장자(광시) · 티베트 문자(티베트) · 위구르 문자(위구르) · 동파 문자 측천문자 · 거란 문자 · 서하 문자 · 여진 문자 · 만주 문자
싱가포르 간체자 · 번체자 · 한어병음 502 간체자
일본 신자체 만요가나
가나 (히라가나 · 가타카나) 헨타이가나
베트남 쯔꾸옥응으 쯔놈 }}}}}}}}}


분류