1. 개요
국제표준화기구(ISO)에서 제정한 언어 이름 및 언어 계통 분류 체계이다. 이는 언어들을 고유한 코드로 식별하여 정보 기술, 도서관학, 번역 등 다양한 분야에서 언어 식별 및 처리를 표준화하는 데 목적을 둔다. ISO 639는 여러 부분으로 구성되어 있으며, 각 부분은 언어 식별 범위와 코드 체계에서 차이를 보인다.2. ISO 639-1
ISO 639의 첫 번째 부분인 ISO 639-1은 세계의 주요 언어들을 위한 간결한 2문자 코드를 제공한다. 이는 가장 널리 사용되는 부분이며, 웹사이트의 언어 설정, 문서의 언어 표시 등에서 흔히 찾아볼 수 있다. ISO 639-1 코드는 총 136개가 등록되어 있으며, 각 코드는 하나의 특정 언어를 대표한다. 예를 들어, 한국어는 ko, 영어는 en, 일본어는 ja로 표기된다. 이 코드는 간결하고 기억하기 쉬워 실용성이 높다는 특징을 가진다.3. ISO 639-2
ISO 639-2는 ISO 639-1보다 더 많은 언어를 포괄하며, 3문자로 구성된 코드를 사용한다. 이는 주로 도서관학 및 서지학 분야에서 더 상세한 언어 식별을 위해 사용된다. ISO 639-2는 약 487개의 언어 코드를 포함하며, 일부 언어의 경우 ISO 639-1 코드가 존재하지 않기도 한다. 또한, ISO 639-2는 언어의 유형에 따라 두 가지 코드 체계를 제공한다. 하나는 서지학적 코드(B)이고 다른 하나는 용어학적 코드(T)이다. 대부분의 경우 이 두 코드는 동일하지만, 일부 집단 언어의 경우에는 서로 다른 코드를 할당하여 더 정확한 분류를 가능하게 한다. 예를 들어, 슬라브어족 전체를 나타내는 코드는 서지학적으로는 sla이지만, 용어학적으로는 slv이다.4. ISO 639-3
더욱 광범위한 언어 식별을 목표로 하는 ISO 639-3는 현존하는 모든 자연어와 고유한 언어들을 포함하는 가장 포괄적인 부분이다. 이는 3문자로 구성된 코드를 사용하며, 약 7,800개 이상의 언어를 식별한다. ISO 639-3는 ISO 639-1 및 ISO 639-2를 포함하며, 이들 코드에 없는 많은 개별 언어와 방언들을 포함한다. 이는 언어학 연구, 지역 언어 보존, 다국어 처리 시스템 등에서 정밀한 언어 식별을 요구하는 분야에서 중요한 역할을 한다. ISO 639-3는 살아있는 언어뿐만 아니라 사멸한 언어, 고대 언어, 인공어의 일부까지 포함한다는 점에서 그 범위가 매우 넓다고 할 수 있다.5. ISO 639-4
ISO 639-4는 ISO 639의 다른 부분들을 위한 일반적인 원칙과 지침을 제공하는 메타 표준이다. 이는 ISO 639의 각 부분이 어떻게 구성되고 사용되어야 하는지에 대한 기본적인 틀을 제시하며, 코드 할당 및 유지 관리에 대한 정책을 포함한다. ISO 639-4는 ISO 639 체계 전체의 일관성과 효율성을 유지하는 데 중요한 역할을 한다.6. ISO 639-5
ISO 639-5는 언어의 개별 형태가 아닌 언어 계통(어족, 어군)을 식별하기 위한 3문자 코드를 제공한다. 이는 특정 언어들의 집합을 나타낼 때 유용하며, 언어학 연구나 다국어 정보 처리에서 언어 그룹별 분석을 수행하는 데 활용된다. 예를 들어, alg 코드는 알곤킨어족을 나타내고, sem 코드는 셈어족을 나타낸다. ISO 639-5는 언어 간의 역사적 및 계통적 관계를 파악하고 분류하는 데 중요한 도구로 기능한다.7. ISO 639-6
ISO 639-6는 가장 상세한 수준의 언어 식별을 제공하기 위해 개발되었으나, 현재는 더 이상 활발하게 사용되지 않는다. 이는 4문자로 구성된 코드를 사용하여 언어의 변이형(방언 등)까지 식별하는 것을 목표로 했다. 그러나 ISO 639-3의 확장과 다른 기술적인 이유로 인해 2014년에 개발이 중단되었다. ISO 639-6에 할당되었던 일부 코드는 ISO 639-3에 통합되기도 했다.ISO 639 표준은 언어 식별의 국제적인 기준으로 자리매김하며, 다양한 시스템과 데이터에서 언어 정보를 일관성 있게 처리하고 교환하는 데 필수적인 역할을 수행한다. 각 부분은 서로 보완적인 기능을 수행하며, 사용 목적과 필요한 상세 수준에 따라 적절한 부분을 선택하여 활용할 수 있다.