특수함수 Special Functions | ||
{{{#!wiki style="margin: 0 -10px -5px; min-height: calc(1.5em + 5px)" {{{#!folding [ 펼치기 · 접기 ] {{{#!wiki style="margin: -5px -1px -11px; word-break: keep-all" | <colbgcolor=#383B3D><colcolor=#fff> 적분 | 오차함수(error function)(가우스 함수 · 가우스 적분 함수) · 베타 함수(불완전 베타 함수) · 감마 함수(불완전 감마 함수 · 로그 감마 함수) · 타원 적분 · 야코비 타원 함수 · 지수 적분 함수 · 로그 적분 함수 · 삼각 적분 함수 · 쌍곡선 적분 함수 · 프레넬 적분 함수 · 구데르만 함수 |
미분방정식 | 르장드르 함수[math(^\ast)] (구면 조화 함수) · 베셀 함수 · 에르미트 함수 · 라게르 함수 · 에어리 함수 | |
역함수 | 브링 근호 · 람베르트 W 함수 · 역삼각함수 | |
급수 | 제타 함수 · 후르비츠 제타 함수 · 세타 함수 · 초기하함수 · 폴리로그함수 · 폴리감마 함수 · 바이어슈트라스 타원 함수 | |
정수론 | 소수 계량 함수 · 소인수 계량 함수 · 뫼비우스 함수 · 최대공약수 · 최소공배수 · 약수 함수 · 오일러 피 함수 · 폰 망골트 함수 · 체비쇼프 함수 · 바쁜 비버 함수 | |
기타 | 헤비사이드 계단함수 · 부호 함수 · 테트레이션(무한 지수 탑 함수) · 지시함수 · 바닥함수 / 천장함수 · 허수지수함수 · 혹 함수 | |
[math(^\ast)] 특수함수가 아니라 특정 조건을 만족시키는 다항함수이지만, 편의상 이곳에 기술했다. |
1. 개요
指示函數 / indicator function특수함수의 하나로, 특성 함수(特性函數, characteristic function)[1]라고도 한다. 가끔 정의와 그 성질에 의해 "집합 판별 함수"로도 불린다. 보통 [math(\bold{1}_{A}(x))][2]로 표기하는데, 가끔 characteristic function의 머리글자인 'ch'에 해당하는 그리스 문자 χ를 사용하여 [math(\chi_A)]로 표기하기도 한다.
정의는 다음과 같다.
[math( \bold{1}_{A}(x) := \begin{cases} 1 & (x \in A) \\ 0 & (x \notin A) \end{cases} \qquad )] (단, [math(A)]는 집합)
또한 집합판별함수는 특히 측도와 적분을 이어주는 데 자주 사용된다.
- 측도 [math(\mu)]와 집합 [math(A)]에 대해 다음이 성립한다.
{{{#!wiki style="text-align: center"
[math(\displaystyle \int\bold{1}_{A}\,\mathrm{d}\mu= \int_{ A } 1\,\mathrm{d}\mu= \mu(A))]}}}
- 고등학교 수학에서는, 구간 [math(A= [a,\, b])]에 대해 다음이 성립한다.
{{{#!wiki style="text-align: center"
[math(\displaystyle \int_{-\infty}^\infty\bold{1}_{A}(x) \, \mathrm{d}x= \int_a^b1\,\mathrm{d}x= b- a)] }}}
또한 기댓값이 본질적으로 적분이고 확률이 측도임을 생각하면, 다음처럼 확률과 기댓값을 이어주는 데 사용된다는 것도 바로 알 수 있다.
- 확률 변수 [math(X)]가 확률 분포 [math(P)]를 따른다면, 사건 [math(A)]에 대해 다음이 성립한다.
{{{#!wiki style="text-align: center"
[math(\begin{aligned}\displaystyle \mathbb{E}[\bold{1}_A(X) ] &= \int_A1\,\mathrm{d}P = P(A)\\\mathbb{E}[X]&=\int_AX\,\mathrm{d}P=\sum_{i=1}^ra_iP(A_i)\end{aligned})]}}}
단, 각 [math(A_i)]들은 상호 배반이며 [math(\displaystyle\bigcup_{i=1}^rA_i=A)]이다.
1.1. 중등교육 수준의 설명
의외로 간단한 함수이다. 이 함수는 [math(\bold{1}_{A}(x))]로 표기되는데, [math(x)]가 집합 [math(A)] 안에 포함되는 원소이면 함숫값이 [math(1)]이 되고 아니면 [math(0)]이 된다. 예를 들어서, 자연수 전체의 집합을 [math(\mathbb{N})]이라고 하면, [math(5)]는 자연수이므로 [math(\bold{1}_{\mathbb{N}}(5)=1)]이고, [math(\sqrt2)]는 자연수가 아니므로 [math(\bold{1}_{\mathbb{N}}(\sqrt2)=0)]이다.아래는 몇몇 예시를 나타낸 표이다.
함수 | 함숫값 |
[math(\bold{1}_{\mathbb{N}}(7))] | [math(1)] |
[math(\bold{1}_{\mathbb{N}}(-3))] | [math(0)] |
[math(\bold{1}_{\mathbb{Z}}(-3))] | [math(1)] |
[math(\bold{1}_{\mathbb{Q}}(7))] | [math(1)] |
[math(\bold{1}_{\mathbb{Q}}(\sqrt2))] | [math(0)] |
[math(\bold{1}_{A}(4))] ([math(A = \{3,\,4,\,5\})]) | [math(1)] |
[math(\bold{1}_{A}(6))] ([math(A = \{3,\,4,\,5\})]) | [math(0)] |
여기서 [math(\mathbb{N})]은 자연수 집합, [math(\mathbb{Z})]는 정수 집합, [math(\mathbb{Q})]는 유리수 집합이다.
한편 소수 [math(\mathbb{P})]를 판별하는 소수 판별 함수 [math(\bold{1}_{\mathbb{P}})]도 생각해볼 수 있는데, [math(\bold{1}_{\mathbb{P}}(x) = 1)]을 만족시키는 수를 찾는 과정이 다름 아닌 에라토스테네스의 체이다.
2. 디리클레 함수(유리수 판별 함수)
삼각함수 · 쌍곡선함수 Trigonometric Functions · Hyperbolic Functions | ||
{{{#!wiki style="margin: 0 -10px -5px; min-height: calc(1.5em + 5px)" {{{#!folding [ 펼치기 · 접기 ] {{{#!wiki style="margin: -5px -1px -11px" | <colbgcolor=#f080b0> 기본 개념 | 기하학{평면기하학(삼각형 · 삼각비 · 원 · 쌍곡선)} · 해석학{좌표계 · 복소평면 · 함수(초월함수 · 특수함수)} |
삼각함수 | 사인곡선(위상수학자의 사인곡선) · 역함수 · 도함수 · 역도함수 · 관련 함수 · 삼각함수의 덧셈정리 · 바이어슈트라스 분해 정리 · 미타그레플레르 정리 · 오일러 공식 · 푸리에 해석(푸리에 변환) · 삼각 적분 함수 · 구데르만 함수 · 프레넬 적분 함수 · 디리클레 함수 · 바이어슈트라스 함수 · 볼테라 함수 · 에어리 함수 · 야코비 타원 함수 | |
쌍곡선함수 | 현수선 · 쌍곡선 적분 함수 · 구데르만 함수 | }}}}}}}}} |
개중에 유리수 집합 [math(\mathbb Q)]를 판별하는 디리클레 함수(Dirichlet function)[3] [math(\bold{1}_{\mathbb Q}(x))]라는 것이 있는데, 집합 판별 함수 중 아래와 같은 특이한 성질을 보이기 때문에 실해석학에서 주로 다뤄진다.
- 모든 실수에서 불연속인 완전 불연속 함수로, 병리적 함수의 일종이다. 그래서 해석기하학적 그래프를 그릴 수 없다.
- 짝함수이다: [math(\bold{1}_{\mathbb Q}(x) = \bold{1}_{\mathbb Q}(-x))]
- 리만 적분[4]으로는 적분이 불가능하고, 르베그 적분으로 적분할 수 있으며 그 값은 0이다.
- 오일러-마스케로니 상수, 브룬 상수, 카탈랑 상수 등 특이점이 무수히 많이 존재한다.[5]
- 삼각함수로 정의가 가능하다: [math(\displaystyle \bold{1}_{\mathbb{Q}}( x ) = \lim_{m \to \infty} \left[ \lim_{n \to \infty} \cos^{2n}( m! \cdot \pi x ) \right] )] (단, [math(m)], [math(n)]은 정수)
이 항등식은 현실적으로는 거의 쓸모없으며 단지 학문적 유희를 위한 식이다. 그러나 유리수, 팩토리얼, 삼각함수, 지수, 그리고 극한 등 중요 개념들을 제대로 이해하고 있는지를 테스트할 수 있는 매우 좋은 식이므로, 수학에 관심 있다면 이 항등식 증명에 도전해보자.
주어진 식의 우변이 [math(x)]가 유리수일 때는 [math(1)], 무리수일 때는 [math(0)]의 값을 가짐을 증명하면 된다.
우선 [math(x)]가 유리수인 경우를 생각하자. 그러면 [math(x=p/q)] 로 나타낼 수 있다. (단, [math(p)], [math(q)]는 정수, [math(q>0)]이며, 증명을 위해선 서로소일 필요는 없다.)
극한이 중첩되어 있어 혼란스러울 수 있으나, [math(\displaystyle f(m):= \lim_{n \to \infty} \cos^{2n}( m! \cdot \pi x ) )] 와 같이 안쪽 극한의 값을 [math(m)]의 함수로 생각하면 편하다. 즉, 우리의 목적은 수열 [math(\lbrace f(m) \rbrace_{m= 1}^\infty)]의 극한을 구하는 것.
[math(m)]이 충분히 큰 경우, 특히 [math(m\geq q)]인 경우 [math(m)]을 고정하고 [math(f(m))]의 값을 살펴보자. 이 경우 제일 안쪽의 식에서 [math(\pi)]를 제외한 부분은
[math(\displaystyle m!\cdot x = m!\times\frac{p}{q} = p\times \frac{m!}{q})]
이 된다. 이때 [math(m\geq q)]이므로, 팩토리얼의 정의에 의해 분자가 분모에 의해 나누어떨어지게 되어 [math(m!/q)]는 정수가 된다. 따라서 제일 안쪽 [math(m!\cdot\pi x)]는 '정수[math(\times \pi)]'의 꼴이 된다. 다음으로 이를 이용하면 코사인의 성질에 의해 [math(\cos(m! \cdot \pi x))]는 [math(-1)] 또는 [math(1)]일 수밖에 없다. 둘 중 어느 경우든지간에, [math(2n)]승 취하면 ([math(n)]이 무슨 값이든지) [math(1)]이 된다.[6] 따라서 결국 우리가 택한 [math(m\geq q)]에 대해서는, 다음이 성립한다.
[math(\displaystyle f(m) = \lim_{n\to\infty}\cos^{2n}(m!\cdot\pi x) = \lim_{n\to\infty}1 = 1)]
즉, 우리가 처음에 고정한 유리수 [math(x)]에 대해, 수열 [math(\lbrace f(m) \rbrace_{m= 1}^\infty)]은 유한한 개수의 항을 제외하고는 [math(1)]의 값을 갖는 수열이다. 따라서 극한의 정의에 의해
[math(\displaystyle \lim_{m \to \infty} \lim_{n \to \infty} \cos^{2n}( m! \cdot \pi x ) = \lim_{m\to\infty}f(m) = 1)]
이 성립한다. 이 등식이 임의의 유리수 [math(x)]에 대해 성립함을 주목하자.
무리수의 경우도 유사하게 증명하면 된다. 이 경우 무리수의 성질에 의해 [math(m)]이 어떤 값이든지 [math(m!\cdot x)]는 정수가 될 수 없다. 코사인의 성질에 의해 [math(\cos(m!\cdot\pi x)\in(-1, 1))]이고, 이를 [math(2n)]제곱을 해나가면 [math(n)]이 커짐에 따라 [math(0)]으로 수렴한다. 즉, [math(\displaystyle\lim_{n\to\infty}\cos^{2n}(m!\cdot\pi x) = 0)]이다. 따라서 [math(x)]가 무리수인 경우, 수열 [math(\lbrace f(m) \rbrace_m^\infty)]는 0으로만 이루어진 수열이고, 이 수열이 [math(0)]으로 수렴함은 자명하다.
}}} ||
3. 활용
집합 판별 함수는 여러 변수들의 범위에 따라 함수식이 달라지는 복잡한 함수를 한 번에 나타낼 수 있게 해 준다. 이러한 테크닉을 사용하면 결합확률밀도함수를 인수분해하여 충분통계량을 찾아내거나, Lindeberg's condition과 같이 르벡-스틸체스 적분을 계산할 때 집합 판별 함수를 사용하는 등 다양한 곳에서 요긴하게 사용되는 수학 개념이다.예를 들어 보자. 확률 변수 [math(X_1, \cdots\!, X_n)]의 확률밀도함수가 [math(i = 1, \cdots\!, n)]에 대하여 각각
[math(
f(x_i|\theta) = \theta x_i^{-2} \quad (0 < \theta \leq x_i < \infty)
)]
f(x_i|\theta) = \theta x_i^{-2} \quad (0 < \theta \leq x_i < \infty)
)]
일 때 인수분해 정리(factorization theorem)를 이용하여 모수 [math(\theta)]에 대한 충분통계량을 구해 보자.
우선 해당 확률변수들의 결합확률밀도함수는 다음과 같다.
[math(
f(x_1, \cdots\!, x_n | \theta) = \begin{cases} \displaystyle \prod_{i=1}^n f(x_i|\theta) \quad &\theta \leq x_1, \cdots\!, x_n \\
0 \quad &\mathsf{otherwise} \end{cases}
)]
f(x_1, \cdots\!, x_n | \theta) = \begin{cases} \displaystyle \prod_{i=1}^n f(x_i|\theta) \quad &\theta \leq x_1, \cdots\!, x_n \\
0 \quad &\mathsf{otherwise} \end{cases}
)]
또한 [math(x_1, \cdots\!, x_n)]이 모두 [math(\theta)] 이상이라는 것은 [math(\min_i x_i \geq \theta)]라는 것과 같다. 따라서 위 식을 다시 쓰면
[math(
f(x_1, \cdots\!, x_n | \theta) = \begin{cases} \displaystyle \prod_{i=1}^n f(x_i|\theta) \quad &\theta \leq \min_i x_i \\
0 \quad &\theta > \min_i x_i \end{cases}
)]
f(x_1, \cdots\!, x_n | \theta) = \begin{cases} \displaystyle \prod_{i=1}^n f(x_i|\theta) \quad &\theta \leq \min_i x_i \\
0 \quad &\theta > \min_i x_i \end{cases}
)]
그러나 이런 상태로는 결합확률밀도함수를 함수끼리의 인수분해 꼴로 나타내기 힘들거니와 무엇보다도 충분통계량을 얻어낼 수 없다. 이때 집합 판별 함수가 빛을 발한다.
[math(
\bold{1}_{[\theta,\infty)} (\min_i x_i) = \begin{cases} 1 \quad &\theta \leq \min_i x_i \\
0 \quad &\theta > \min_i x_i \end{cases}
)]
\bold{1}_{[\theta,\infty)} (\min_i x_i) = \begin{cases} 1 \quad &\theta \leq \min_i x_i \\
0 \quad &\theta > \min_i x_i \end{cases}
)]
로 집합 판별 함수를 정의하면 조각적 정의를 명시적으로 쓰지 않고도 결합확률밀도함수를 다음과 같이 간단히 나타낼 수 있는 것이다.
[math(\displaystyle \begin{aligned}
f(x_1, \cdots\!, x_n | \theta) &= \prod_{i=1}^n f(x_i|\theta) \times \bold{1}_{[\theta,\infty)} \!\left( \min_i x_i \right) \\
&= \theta^n \prod_{i=1}^n x_i^{-2} \times \bold{1}_{[\theta,\infty)} \!\left( \min_i x_i \right)
\end{aligned})]
f(x_1, \cdots\!, x_n | \theta) &= \prod_{i=1}^n f(x_i|\theta) \times \bold{1}_{[\theta,\infty)} \!\left( \min_i x_i \right) \\
&= \theta^n \prod_{i=1}^n x_i^{-2} \times \bold{1}_{[\theta,\infty)} \!\left( \min_i x_i \right)
\end{aligned})]
인수분해 정리를 사용하기 위하여 이를 다시 쓰면
[math(\begin{aligned}
f(x_1, \cdots\!, x_n | \theta) &= {\color{red} g(T(x)|\theta) } \,{\color{blue} h(x) } \\
&= {\color{red} \theta^n \times \bold{1}_{[\theta,\infty)} \!\left( \min_i x_i \right) } \,{\color{blue} \prod_{i=1}^n x_i^{-2} }
\end{aligned})]
f(x_1, \cdots\!, x_n | \theta) &= {\color{red} g(T(x)|\theta) } \,{\color{blue} h(x) } \\
&= {\color{red} \theta^n \times \bold{1}_{[\theta,\infty)} \!\left( \min_i x_i \right) } \,{\color{blue} \prod_{i=1}^n x_i^{-2} }
\end{aligned})]
으로 훌륭하게 인수분해되므로, 충분통계량은 다름 아닌 [math(T(x) = \min_i x_i)]이다. 집합 판별 함수를 사용하기 전에는 결합확률밀도함수에 [math(\min_i x_i)]가 명시적으로 드러나 있지 않았으나, 집합 판별 함수를 통해 이를 명시적으로 표시할 수 있게 되어 인수분해 정리가 적용된 것이다. 집합 판별 함수의 도움 없이는 불가능한 일이다.
4. 관련 문서
[1] 다만 '특성 함수'라는 말은 다른 개념을 일컫기도 한다. 적률생성함수와 유사하게, 확률 분포를 특정해 주는 역할을 하는 함수를 뜻하기도 하는 것이다. 특히 이 특성함수는 적률생성함수가 없는 확률 분포도 특정해줄 수 있다.[2] 숫자 [math(1)]과 구별하기 위해 볼드체로 표기한다. indicator function의 머리글자인 I를 사용하여 [math(\mathbb{I}_A)], [math(I_A)] 혹은 1을 겹친 𝟙[math({}_{A})]를 쓰기도 한다.[3] 고안자인 페터 구스타프 르죈 디리클레의 이름을 따왔다.[4] 고등학교 때 배우는 적분법을 미분적분학 기준 대학교 1학년 및 해석학 기준 대학교 2학년 수준에서 확장한 것. 주어진 구간을 [math(n)]등분하는 대신 아무렇게나 쪼개고, 오른쪽 값이나 왼쪽 값 등을 고르는 것이 아니라 각 구간에서의 최댓값과 최솟값을 고르는 정도의 차이가 존재한다. 고등학교식 적분이 리만 적분이 아니라는 증거이기도 하다. 고등학교식으로 0부터 1까지 적분하면 각 구간마다 [math(\displaystyle \frac{1}{n} \in \mathbb{Q})]이므로 [math(\bold{1}_{\mathbb{Q}}( x )=1)]이 돼서 1로 적분된다.[5] 사실 당연한 것이, 이들은 유리수인지 무리수인지가 아직 밝혀지지 않았기 때문이다. 언젠가는 저 점들도 특이점이 아닐 날이 올 것이다.[6] 왜 쓸모없는 [math(n)]이 들어있는지 궁금하다면, 추후에 무리수인 경우를 마저 따져보자.