최근 수정 시각 : 2024-09-16 17:25:43

메타데이터


[[컴퓨터공학|컴퓨터 과학 & 공학
Computer Science & Engineering
]]
[ 펼치기 · 접기 ]
||<tablebgcolor=#fff,#1c1d1f><tablecolor=#373a3c,#ddd><colbgcolor=#0066DC><colcolor=white> 기반 학문 ||수학(해석학 · 이산수학 · 수리논리학 · 선형대수학 · 미적분학 · 미분방정식 · 대수학(환론 · 범주론) · 정수론) · 이론 컴퓨터 과학 · 암호학 · 전자공학 · 언어학(형태론 · 통사론 · 의미론 · 화용론 · 음운론) · 인지과학 ||
하드웨어 구성 SoC · CPU · GPU(그래픽 카드 · GPGPU) · ROM · RAM · SSD · HDD · 참조: 틀:컴퓨터 부품
기술 기계어 · 어셈블리어 · C/C++ · C# · Java · Python · BIOS · 절차적 프로그래밍 · 객체 지향 프로그래밍 · 해킹 · ROT13 · 일회용 비밀번호 · 사물인터넷 · 와이파이 · GPS · 임베디드 · 인공신경망 · OpenGL · EXIF · 마이크로아키텍처 · ACPI · UEFI · NERF · gRPC · 리버스 엔지니어링 · HCI · UI · UX · 대역폭 · DBMS · NoSQL · 해시(SHA · 브루트 포스 · 레인보우 테이블 · salt · 암호화폐) · RSA 암호화 · 하드웨어 가속
연구

기타
논리 회로(보수기 · 가산기 · 논리 연산 · 불 대수 · 플립플롭) · 정보이론 · 임베디드 시스템 · 운영 체제 · 데이터베이스 · 프로그래밍 언어{컴파일러(어셈블러 · JIT) · 인터프리터 · 유형 이론 · 파싱 · 링커 · 난해한 프로그래밍 언어} · 메타데이터 · 기계학습 · 빅데이터 · 폰노이만 구조 · 양자컴퓨터 · 행위자 모델 · 인코딩(유니코드 · MBCS) · 네트워크 · 컴퓨터 보안 · OCR · 슈퍼컴퓨터 · 튜링 머신 · FPGA · 딥러닝 · 컴퓨터 구조론 · 컴퓨터 비전 · 컴퓨터 그래픽스 · 인공지능 · 시간 복잡도(최적화) · 소프트웨어 개발 방법론 · 디자인 패턴 · 정보처리이론 · 재귀 이론 · 자연어 처리(기계 번역 · 음성인식) · 버전 (버전 관리 시스템 · Git · GitHub)


파일:xkcd metadata ko.png

xkcd 688화 "Self Description"

1. 개요2. 메타데이터의 종류
2.1. 기술용 메타데이터2.2. 관리용 메타데이터2.3. 구조용 메타데이터
3. 메타데이터 포맷 종류4. 관련 문서

1. 개요

Metadata

데이터에 관한 구조화된 데이터로, 다른 데이터를 설명해 주는 데이터다.

메타(Meta)는 일반적으로 "~에 관한"(about)이라는 의미로 사용된다. 따라서 메타언어는 다른 데이터를 기술하기 위해 사용되는 언어이며 메타데이터는 다른 데이터를 기술하기 위해 사용하는 데이터라고 할 수 있다. 인쇄 출판물을 포함한 모든 유형의 정보자원을 기술하는 용어이기 때문에 문헌정보학을 전공하는 학생이라면 머리 아프게 외워야 하는 학문이다.

1990년대 초반까지 이 용어는 과학 및 사회과학, 지형공간의 데이터세트에 관련하여 컴퓨터 파일이 인간에게 도움이 되도록 하기 위해 필요한 정보라는 의미로 사용되었다.

이용자는 메타데이터로 자기가 원하는 특정 데이터를 검색엔진 등으로 쉽게 찾아낼 수 있다. 이에 대한 예시로 월드컵을 녹화한 비디오에서 골 장면만을 뽑아낼 수 있고, 메타데이터는 이 자료를 이용하여 뽑아낼 수 있다.
그러나 메타데이터는 데이터를 사용하는 사람에게는 보이지 않으며 컴퓨터가 이러한 메타데이터의 내용을 이해하고 이를 이용한다.

2. 메타데이터의 종류

2.1. 기술용 메타데이터

정보자원의 검색을 목적으로 한 메타데이터. 기술용 메타데이터의 목적은 어떤 자원을 어떻게 찾아내는지의 발견(discovery), 어떤 자원을 다른 유사한 자원과 어떻게 구분하는지에 대한 식별, 어떤 자원이 특정 자원을 만족시킨다는 사실을 어떻게 결정하는 지의 목적을 충족시키는 선정 등이 있다. 전통적인 도서관 편목에서의 메타데이터는 기본적으로 기술적인 것들이다.

2.2. 관리용 메타데이터

자원의 관리를 어떻게든 용이하게 하기 위한 메타데이터. 어떤 객체가 언제 어떻게 작성되었나, 주 내용에 대한 접근을 관리하는 등의 책임은 누가 가지며, 접근이나 이용에 대한 어떤 제약이 적용될 수 있는지를 포함한다. 그러나 일반적으로 기술용과 관리용 사이의 경계는 애매모호하며 그 기준은 메타데이터 이용자의 시각에 따라 결정되는 경우가 많다.

2.3. 구조용 메타데이터

복합적인 디지털 객체들을 함께 묶어주기 위한 메타데이터. 물리적인 파일과 페이지, 페이지의 장, 장과 전체로서의 책 사이의 관계를 기록하기 위해 필요하다. 구조용 메타데이터는 수치 데이터세트와 통계 데이터세트의 데이터 요소의 순서와 포맷을 문서화하며, 그 목적이 어떤 엔티티의 이용이 가능하도록 하는 것이다.

3. 메타데이터 포맷 종류

현재는 파일이 일종의 "컨테이너"로서 파일 형식에 따른 전용 메타데이터 구조/형식을 갖지만 메타데이터 개념이 없었을 시절에 만들어지고 널리 사용된 파일형식은 시간이 지나 필요에 의해 별도 이름/형식의 메타데이터가 붙게 되었다.

* 이미지 태그
* EXIF: JPG의 메타데이터, 디지털 카메라 회사에서 관여한 표준이다.
* XMP: PNG의 메타데이터, Adobe에서 제정한 ISO 표준이다.
* 음악 태그
* ID3: MP3의 메타데이터. ID3v1(파일 끝에 기록), ID3v2(파일 시작부에 기록) 버전이 있으며, ID3v2.4(UTF-8), v2.3(ISO-8859-1, 로마자용), v2.3(UTF-16, 한국어 포함 국제용, 윈도우 7에서 지원) 버전이 있다. AAC, DSF같이 메타데이터를 넣을 것을 계획하지 않았던 음악 파일들도 이 방식의 메타데이터를 끌어다 쓰기도 한다.
* APE: MP3의 메타데이터. APEv1, APEv2 버전이 있다.
* Vorbis comment: FLAC, Ogg, Opus(오디오 코덱) 등의 Xiph.Org를 비롯한 자유 소프트웨어 단체들이 지원하는 메타데이터.
* m4a의 경우 mp4 컨테이너 표준을 따른다. ISO나 Quicktime이나 iTunes Metadata로 불리기도 한다.
* WMA의 경우 WMV 컨테이너 표준을 따른다.
* MKA의 경우 MKV 컨테이너 표준을 따른다. Matroska Tags로 불린다.
* 자막[1]
* smi: 국내 자막
* srt: 해외 자막
* lrc: 알송에서 지원하는 자막
* 영상 태그
* ISO/IEC 14496-12, ISO/IEC 15444-12: MP4의 컨테이너로서 메타데이터 정보도 함께 정의하고 있다.
* MKV의 경우 자체 표준을 따른다. WebM은 MKV에서 발전되었다.

4. 관련 문서



[1] 파일 옆에 별도의 파일로 존재하면 사이드카 파일로 불리기도 한다.