최근 수정 시각 : 2024-10-09 14:52:20

에서 넘어옴
1. 개요2. 발생 원인3. 기타4. 관련 문서

1. 개요


U+FFFD, REPLACEMENT CHARACTER

텍스트의 인코딩과 디코딩이 잘못됐을 때 생기는 것. Windows, macOS, Android에선 생김새는 마름모(◆)에 물음표(?)가 들어간 모습이다. 글꼴이나 운영체제에 따라, 대표적으로 iOS, 리눅스, 닌텐도 스위치에서는 마름모 대신 배경이 흰 사각형(□) 모양이 대신 표시되기도 한다. 또는 이 흰 사각형 안에 가위표 (X)가 들어가 있기도 하는데 이는 tofu라고 하며 주로 한자의 문자 깨짐 현상에서 나타난다. 나무위키에서도 네트워크 연결이 안 될때 □ 안에 (X)가 들어가며 문서 자체에는 문제가 없지만 검색하기 등의 UI에서 이렇게 깨지는 현상이 발생한다. 또한 Windows XP 등 옛 운영체제에선 물음표 없이 그냥 사각형만 등장한다. 모질라 파이어폭스에서는 이 글자 자체(U+FFFD)를 제외한 깨진 문자들을 회색 사각형 안에 회색 글씨로 16진수의 유니코드의 번호를 표시하는 식으로 표현한다.

2. 발생 원인

문서를 UTF-8로 저장하는 과정에서 이상이 있어 문서가 온전하게 저장되지 못하면 이렇게 된다. 문서를 UTF-8로 저장할 때, UTF-8에서 유효하지 않은 바이트나 byte sequence는 이 �로 대체된다. 따라서 이 문자는 정상적인 경우에는 절대 출력되지 않는다. 쉽게 말해 오류 문자.

3. 기타

제대로 저장되지 못한 UTF-8 문서를 EUC-KR나 EUC-CN으로 읽으면 占쏙옙, 锟斤拷 등이 출력된다.

유니코드에서만 사용되는 인코딩이기 때문에 EUC-KR(완성형)이나 EUC-CN(간체자), Shift_JIS(일본어) 등의 MBCS 인코딩이나, Windows-1252(서유럽어) 등의 ANSI 인코딩에서는 이 문자를 표시하거나 저장할 수 없으며, 따라서 물음표(?) 내지는 언더바(_)로 바뀌어서 표시되거나 저장된다.

단순히 폰트가 없어서 발생하는 tofu와는 다르다. tofu는 데이터가 깨지지 않고 온전히 보존되어 있어 환경만 바뀌면(글꼴 설치, 다른 컴퓨터 사용 등) 정상으로 돌아온다.

3.1. 나무위키에서

지원하지 않는 이모지를 입력하면 이 문서로 이동된다.

4. 관련 문서