최근 수정 시각 : 2025-05-24 11:50:42

크로스피드

1. 개요2. 원리
2.1. 헤드폰 청취의 문제점2.2. 크로스피드의 작동 방식
3. 장점4. 단점
4.1. 대처법

1. 개요

Crossfeed

헤드폰으로 음원을 감상할 때, 마치 스피커로 듣는 것과 유사한 청취 경험을 제공하기 위한 음향 처리 기술이다. 헤드폰 특유의 극단적인 채널 분리로 인해 발생하는 머릿속에 음상이 맺히는 현상(IHL, In-Head Localization)을 완화하고, 보다 자연스러운 정위감을 형성하는 것을 목표로 한다.

2. 원리

2.1. 헤드폰 청취의 문제점

일반적으로 스피커를 통해 소리를 들을 때, 왼쪽 스피커에서 나온 소리는 왼쪽 귀뿐만 아니라 오른쪽 귀에도 도달한다. 이때 오른쪽 귀에 도달한 소리는 머리를 거치며 회절 및 차폐 효과(Head Shadowing)가 발생해 고음역이 감쇠되고, 왼쪽 귀보다 약간 늦게 소리가 도달하며(양이 시간차, ITD - Interaural Time Difference), 음압 또한 작게 들린다(양이 음압차, ILD - Interaural Level Difference). 이러한 정보들은 인간이 음원의 위치와 공간감을 인지하는 데 중요한 단서로 작용한다.

반면, 헤드폰은 각 채널의 소리가 반대편 귀에 거의 전달되지 않고 직접적으로 해당 귀에만 전달되는 구조를 가진다. 이로 인해 좌우 채널이 극단적으로 분리되어 들리며, 소리가 머리 안쪽이나 귀 바로 옆에서 들리는 듯한 부자연스러운 음상을 형성하게 된다. 이는 장시간 청취 시 피로감을 유발할 수 있으며, 특히 오래된 스테레오 음반과 같이 극단적인 패닝이 적용된 음원에서 두드러진다.

2.2. 크로스피드의 작동 방식

크로스피드는 이러한 헤드폰 청취의 한계를 극복하기 위해, 스피커 청취 환경에서 발생하는 자연스러운 채널 간 혼합, 즉 크로스토크를 인위적으로 모방한다. 구체적인 작동 방식은 다음과 같다.
  1. 신호 분기: 왼쪽 채널의 신호를 가상 채널로 가져온다.
  2. 딜레이: 가져온 신호에 미세한 시간 지연을 적용한다. 이는 왼쪽 스피커에서 나온 소리가 오른쪽 귀에 도달하기까지 걸리는 시간을 모방한 것으로, 주로 수백 마이크로초(µs)에서 수 밀리초(ms) 사이의 값을 사용한다.
  3. 필터링: 머리에 의한 고음역 감쇠 효과를 모방하기 위해 필터를 적용한다. 주로 고주파수 대역을 감쇠시키는 로우패스 필터나 쉘빙 필터를 사용한다.
  4. 혼합: 이렇게 처리된 신호를 원래의 오른쪽 채널 신호에 혼합한다.

오른쪽 채널의 신호에 대해서도 동일한 과정을 거쳐 왼쪽 채널에 혼합한다.

이러한 과정을 통해 헤드폰에서도 각 귀가 반대편 채널의 소리를 인지하게 되어, 음상이 눈 앞에, 즉 머리 앞쪽으로 이동했다고 느끼게 된다. 이것이 완벽해 머리 바깥에서 소리가 난다고 인지하면, 이를 Out of Head라고 하며 이것이 이상적인 크로스피드의 목표다.

크로스피드를 구현하는 알고리즘은 소프트웨어마다 지연 시간, 필터 특성, 혼합 레벨 등의 파라미터가 다를 수 있으며, 사용자가 이를 조절할 수 있는 경우도 많다.

3. 장점

헤드폰 사용자들은 잘 느끼지 못하는 부분이지만, 크로스피드조차 없는 쌩 헤드폰에서 소리를 듣는 방식은 자연에 존재하지 않는 방식이다. 즉, 인간이 적응해온 듣기 방식과 호환되지 않는다.[1] 크로스피드는 이 문제를 제한적이나마 해결한다.

소리의 덩어리가 단순히 양 옆에서, 또는 머리 안에서 앞으로 이동하는 수준이 아니다.[2] 머릿 속에서 완전히 뭉개져 2d[3] 혹은 선분에 가까운 인상으로 음원을 듣게 되는 기존의 음상과 달리, 머리 앞과 옆을 삼각기둥, 또는 반원통으로 연결하는 듯한 입체적인 음악을 들을 수 있게 된다.

유력한 경쟁자인 BRIR에 비해 적용하기 훨씬 쉽다는 것도 장점이다.

4. 단점

원본 신호에 인위적인 처리를 가하는 것이므로, 미세한 음색 변화나 위상 왜곡이 발생할 수 있다. 특히 크로스피드는 한쪽 채널의 소리를 지연시키고 필터링하여 반대쪽 채널에 혼합하는 방식으로 작동하는데, 이 과정에서 완벽한 흉내를 내는 것은 사실상 불가능하다.[4] 냉정히 말해 단순히 기존 사운드를 가공하여 옮겨붙이는 것에 가깝기 때문에, 의도한 효과와는 다른 결과가 나타날 가능성이 제법 높다.

예를 들어, 크로스피드의 이상적인 목표는 '왼쪽 스피커에서 나온 소리가 머리와 공간을 거쳐 자연스럽게 오른쪽 귀에도 들리는 효과'를 모방하는 것이다. 하지만 실제로는 이러한 모사가 불완전하여, 마치 '왼쪽 채널의 음원(예: 보컬, 악기)이 오른쪽 귀 근처에 별개의 가상 음원으로서 어색하게 추가된 것처럼' 느껴지거나, 심지어 '왼쪽 스피커 자체가 오른쪽으로 옮겨져서 소리가 나는 것처럼' 음상이 부자연스럽게 왜곡될 수 있다. 즉, 간접음을 모사해야 하는데 직접음을 이어붙여 모노 스피커에 가까운 음상이 되는 치명적인 부작용이 발생할 수가 있는 것이다.[5]

이러면, 스테레오에서 기대할 수 있는 입체 음향과 왼쪽/오른쪽 구분이 아예 개박살이 나기 때문에, 크로스피드를 걸기 전보다도 음질이 나빠지는 역효과가 생길 수 있다. 그러므로, 소리가 좀 이상하게 들리는 것 같다면 반드시 조정하거나 다른 크로스피드 솔루션을 알아보는 것이 좋다.

바이노럴 레코딩, ASMR 등은 크로스피드 적용을 전혀 고려하지 않고 제작되므로, 이런 음원을 사용한다면 잠시 크로스피드를 풀 필요가 있다.

4.1. 대처법

ITD, ILD는 어쩔 수 없지만 HRTF는 어느정도 보정할 수 있는 방법이 있다. 이퀄라이저로 개인이 듣는 응답을 평평하게 맞추는 것이다.

Out of Head를 달성하기 위해서는 헤드폰의 선형 왜곡을 보정하는 것이 굉장히 중요하다. 뇌는 평생 자기 몸에 꼭 맞는 HRTF만을 공간감의 척도로 삼는데, 헤드폰의 선형 왜곡은 이를 교란하기 때문이다. 이러면 뇌는 크로스피드에 의해 적용된 ITD, ILD에 근거해[6] 불완전한 정보를 착시처럼 끼워맞추므로 불완전한 결과물이 나오게 된다. 가뜩이나 크로스피드 자체가 불완전한데, 그게 더 교란되면 정상적인 소리를 듣기 어려워진다.

인지적으로 동일한 음량으로 특정 주파수의 사인파를 들을 수 있게 해주는 프로그램 등을 켜놓고 Equalizer APO 등으로 최대한 비슷하게 들리도록 잘 맞춰보면 큰 도움이 된다.


[1] 즉, 자연스럽지 않다.[2] 그렇게 느껴지는 경우도 있는데, 설정이 맞지 않는 것이므로 설정을 조정하거나 다른 소프트웨어를 찾아야 한다.[3] 이 경우, 보통은 사각형일 것이다. 헤드폰을 오래 들어 적응한 사람이 이렇게 느끼는 편이다.[4] 당장 BRIR과 달리 실제 사람의 ITD, ILD와 HRTF를 모른다고 가정하고 보편화된 방식으로 보정하는데, 안타깝게도 이들은 그 사람이 듣는 방식이라 매우 중요한 정보이다. 게다가 이들은 사람마다 많이 다르다.[5] 이를 줄이기 위해 보정을 쎄게 하거나 본 문서에서 설명한 것보다 훨씬 복잡한 이론을 동원하고, 혹은 벨벳 노이즈를 넣어 비상관화를 시키는 등 여러 방법이 동원되지만, 현실적으로 완벽하지는 못하다.[6] 여기에 BRIR 유저라면 반사음을 더한다.