최근 수정 시각 : 2022-01-10 19:18:01

선형대수학의 기본정리

선형대수학
Linear Algebra
{{{#!wiki style="margin: 0 -10px -5px; min-height: calc(1.5em + 5px)"
{{{#!folding [ 펼치기 · 접기 ]
{{{#!wiki style="margin: -5px -1px -11px"
<colbgcolor=#006ab8> 기본 대상 일차함수 · 벡터 · 행렬 · 선형 변환
대수적 구조 가군(모듈) · 벡터 공간 · 내적 공간 · 노름 공간
선형 연산자 <colbgcolor=#006ab8> 기본 개념 연립방정식 · 행렬곱 · 단위행렬 · 역행렬크라메르 공식 · 가역행렬 · 전치행렬 · 행렬식(라플라스 전개) · 주대각합
선형 시스템 기본행연산기본행렬 · 가우스-조르당 소거법 · 행사다리꼴 · 행렬표현 · 라그랑주 보간법
주요 정리 선형대수학의 기본정리 · 차원 정리 · 가역행렬의 기본정리 · 스펙트럼 정리
기타 제곱근행렬 · 멱등행렬 · 멱영행렬 · 에르미트 행렬 · 야코비 행렬 · 방데르몽드 행렬 · 아다마르 행렬 변환 · 노름(수학)
벡터공간의 분해 상사 · 고유치 문제 · 케일리-해밀턴 정리 · 대각화(대각행렬) · 삼각화 · 조르당 분해
벡터의 연산 노름 · 거리함수 · 내적 · 외적(신발끈 공식) · 다중선형형식 · · 크로네커 델타
내적공간 그람-슈미트 과정 · 수반 연산자(에르미트 내적)
다중선형대수 텐서 · 텐서곱 · 레비치비타 기호 }}}}}}}}}


1. 개요2. 설명
2.1. 특수한 경우2.2. 일반적인 경우
3. 선형대수학의 기본정리
3.1. 설명3.2. 진술
4. 증명
4.1. 선형성
4.1.1. ΨCB\displaystyle \mathsf{\Psi}_{\mathfrak{C}}^{\mathfrak{B}} 는 선형변환4.1.2. ΦCB \mathsf{\Phi}_{\mathfrak{C}}^{\mathfrak{B}} 는 선형변환
4.2. 전단사
4.2.1. ΨCB \mathsf{\Psi}_{\mathfrak{C}}^{\mathfrak{B}} 는 전단사4.2.2. ΦCB \mathsf{\Phi}_{\mathfrak{C}}^{\mathfrak{B}} 는 전단사
4.3. 두 대응 간의 역함수 관계4.4. 합성과 곱의 관계
5. 기저의 변환6. 같이 보기

1. 개요

선형대수학의 기본정리란, 두 유한차원 벡터공간 사이에 정의된 선형변환의 집합과 m×nm\times n 행렬의 집합에 덧셈과 스칼라배, 그리고 (잘 정의된) 합성을 보존하는 일대일 대응 함수[1]가 존재한다는 것이다. 이 정리에 "기본정리"라는 이름까지 붙은 이유는, 선형변환을 마치 행렬처럼, 행렬을 마치 선형변환처럼 다룰 수 있다는 것을 이 정리가 보장해주기 때문이다.

행렬선형사상의 동치성은 선형대수학의 핵심 주제이긴 하지만, 이것을 '선형대수학의 기본정리'라는 이름으로 부르는 것은 의외로 일부 문헌에 한정되어 있다. 위키백과에서도 이 명칭은 길버트 스트랭 교수가 유행시키기는 했지만 수학계 전반에서 인정받는 명칭은 아니라고 서술하고 있다. 이 문서의 서술은 주로 이인석 저 "학부 대수학 강의 1: 선형대수와 군"을 따르고 있지만, 이를 제외한 대부분의 교재에서는 이 동치성에 별도의 이름을 붙이지 않는다. 외서의 경우에는 Strang의 교재[2]처럼 선형대수학의 기본정리를 차원 정리에 연결하는 경우가 훨씬 빈번하다. 나무위키 내의 다른 선형대수학 문서들도 비슷하게 "선형대수와 군"으로부터 많은 영향을 받았기 때문에 이 '선형대수학의 기본정리'라는 이름이 많이 쓰이긴 하지만, 범용적인 명칭은 아니므로 주의하자.[3] 이 문서의 표기법도 "선형대수와 군"을 따르기 때문에 다른 곳에선 얼마든지 대체될 수 있다.

2. 설명

2.1. 특수한 경우

이 정리의 아이디어를 이해하기 위해서 우선 가장 간단한 경우를 살펴보자. 즉, F F 가 주어져 있을 때, Fn F^n 에서 Fm F^m 로 가는 선형 변환 L L 을 생각하자. 이 선형 변환이 대응될 행렬을 A A 라 했을 때, 모든 벡터에 대해 L(v)=Av L(v) = Av 가 성립해야 한다. 그런데 v v 의 좌표를 (v1,,vn)t \left( v_1, \cdots, v_n\right)^t [4]라고 하면 Av=[A]1v1++[A]nvn Av = [A]^{1} v_{1} + \cdots + [A]^{n} v_{n} (단, [A]i [A]^i 들은 A의 i번째 열이다)가 성립한다. 이 때 Fn F^n 의 표준 기저를 E={e1,,en} \mathcal{E} = \left\{ e_1, \cdots, e_n \right\} 라고 하면, L(ei)=Aei L(e_i) = Ae_i ii번째 열 [A]i [A]^i 와 같을 수밖에 없다.[5] 즉, L L 에 대응되는 행렬 A A 사실 i i 번째 열이 L(ei) L(e_i) 인 행렬이다!

아래의 내용도 표현이 좀 복잡할 뿐이지 본질적인 아이디어는 이 특수한 경우에서 벗어나지 않는다. 다만, 현재 상황에서는 주어진 선형 변환의 정의역과 공역이 Fn F^n Fm F^m 라는 가장 기본적인 벡터 공간이고, 행렬을 대응시키기 위해 사용하는 기저도 가장 다루기 편한 표준 기저로 주어져 있다. 아래에서 선형 변환과 행렬을 대응시키기 위해 사용하는 복잡한 함수들은 일반적인 상황을 가장 특수하고 다루기 쉬운 현재 상황으로 바꾸기 위한 것들이다.

2.2. 일반적인 경우

F F 위의 벡터 공간 V,W V, W 선형 변환 L:VW L:V\rightarrow W가 주어져 있다고 하자. 이 일반적인 경우에도 우리는 A A 를 위와 같이 정의할 것이다. 하지만 그러기 위해서는 위 문단에서의 표준 기저 E \mathcal{E} 에 대응하는 것이 있어야 하므로, V V 순서가 주어진 기저[6] B={v1,,vn} \mathfrak{B} = \left\{ v_1, \cdots, v_n\right\} W W 순서가 주어진 기저 C={w1,,wm}\mathfrak{C} = \left\{ w_1, \cdots, w_m \right\} 가 주어져 있다고 하자[7].

그런데 L(vi) L(v_i) 가 열벡터라는 보장은 없으므로 A=(L(v1),,L(vn)) A = (L(v_1), \cdots, L(v_n) )이라고 정의하는 것은 애초에 말이 되지 않는다. 이 문제를 해결하기 위해서는 L(vi) L(v_i) 대신 L(vi) L(v_i) C \mathfrak{C} 에 대한 좌표를 사용해야 한다. 좌표의 정의를 모르는 독자는 아래 내용을 참고하자. 어찌 됐든, 이제 우리는 L L 에 대응되는 A A ([L(v1)]C,,[L(vn)]C) ( [L(v_1)]_{\mathfrak{C}}, \cdots, [L(v_n)]_{\mathfrak{C}} ) 로 정의하고, [L]CB [L]_{\mathfrak{C}}^{\mathfrak{B}} 라고 표기하며[8] 이를 선형 변환 L L 행렬 표현이라 부른다.
【좌표의 정의】
좌표에 대한 정의를 간단히 요약하면, vV v \in V v=c1v1++cnvn v = c_{1}v_{1} + \cdots + c_{n}v_{n} 으로 표현될 때, [v]B=(c1,,cn)t [v]_{\mathfrak{B}} = (c_1, \cdots, c_n)^t v v 의 (B \mathfrak{B} 에 대한) 좌표라고 한다[9]. 이 벡터를 좌표라고 부르는 이유는 이 벡터가 기존의 좌표의 정의를 확장한 것이기 때문이다. 이를 설명하기 위해 Fn F^n 에서 v=(v1,,vn)t v = (v_1, \cdots, v_n)^t 를 생각해보자. 그러면 v v v1e1++vnen v_1 e_1 + \cdots + v_n e_n 으로 나타내어지고, 따라서 [v]E=(v1,,vn)t [v]_{\mathcal{E}} = (v_1, \cdots, v_n)^t 가 성립한다. 즉 v v 의 좌표 (v1,,vn)t (v_1, \cdots, v_n)^t 사실 v v E \mathcal{E} 에 대한 좌표인 것이다!

【기저의 순서에 관한 문제】
다만 행렬 표현의 정의에 사소한 문제가 있다. {v1,v2} \left\{ v_1, v_2\right\} {v2,v1} \left\{ v_2, v_1\right\} 는 집합으로서는 똑같은 집합이지만, 위의 정의에서 이렇게 기저의 원소들의 순서를 바꿔버리면 행렬 표현의 열들의 위치가 변해버리기 때문이다. 이 때문에 선형 대수학에서는 기저들의 원소 사이에 순서가 있다고 가정하고, 같은 원소로 이루어진 기저라도 순서가 다르면 다른 기저로 본다.

그러면 이 행렬 A A 가 선형 변환 L L 에 대응한다는 것은 무엇을 의미할까? 위와 똑같이 L(v)=Av L(v) = A v 라고 할 수는 없다. v v 는 열 벡터가 아니기 때문이다. 물론 해결법은 위와 마찬가지로 기저에 대한 좌표를 사용하는 것이다. 즉 L L A A 에 대응된다는 것은 L(v) L(v) C \mathfrak{C} 에 대한 좌표가 A[v]B A [v]_{\mathfrak{B}} 로 표현된다는 것이다. 이 사실이 참이라는 것은 [L(v)]C=[L(c1v1++cnvn)]C= [L(v)]_{\mathfrak{C}} = [L(c_1 v_1 + \cdots + c_n v_n)]_{\mathfrak{C}} = c1[L(v1)]C++cn[L(vn)]C= c_1 [L(v_1)]_{\mathfrak{C}} + \cdots + c_n [L(v_n)]_{\mathfrak{C}} = c1[A]1++cn[A]n=A[v]Bc_1 [A]^1 + \cdots + c_n [A]^n = A [v]_{\mathfrak{B}} [10]라는 계산을 통해 알 수 있다. 결론을 깔끔한 수식으로 나타내면 아래와 같다.
[L(v)]C=[L]CB[v]B \displaystyle [L(v)]_{\mathfrak{C}} = [L]_{\mathfrak{C}}^{\mathfrak{B}} [v]_{\mathfrak{B}}

3. 선형대수학의 기본정리

3.1. 설명

이제 기본적인 아이디어에 대한 설명은 끝났으니 선형대수학의 기본정리의 내용에 대해 설명한다. 선형 변환 L:VW L:V \to W V V 에서 W W 로 가는 선형 변환들의 집합 L(V,W) \mathfrak{L}(V, W) 의 원소이고, 그에 대응되는 행렬 [L]CB [L]_{\mathfrak{C}}^{\mathfrak{B}} F F 위의 m×n m \times n 행렬들의 집합 Mm,n(F) \mathfrak{M}_{m, n}(F) 의 원소이다. 그렇다면, 선형 변환 L L [L]CB [L]_{\mathfrak{C}}^{\mathfrak{B}} 에 대응시키는 것은 L(V,W) \mathfrak{L}(V, W) 에서 Mm,n(F) \mathfrak{M}_{m, n}(F) 로 가는 함수라고 할 수 있다. 선형대수학의 기본정리는 이 대응이 사실은 두 벡터 공간 사이의 동형 사상이라고 주장한다. 즉, 각각의 선형 변환 L L 를 그 행렬 표현 [L]CB [L]_{\mathfrak{C}}^{\mathfrak{B}} 와 같은 대상으로 보면 두 벡터 공간은 본질적으로 동일한 벡터 공간이란 뜻이다.

이 대응이 동형 사상이라는 것은 우선 선형 변환 L+M L + M 이 행렬 [L]CB+[M]CB [L]_{\mathfrak{C}}^{\mathfrak{B}} + [M]_{\mathfrak{C}}^{\mathfrak{B}} 에 대응되고, cL c L 은 행렬 c[L]CB c [L]_{\mathfrak{C}}^{\mathfrak{B}} 에 대응된다는 뜻이다. 또한, 이 대응이 역함수가 존재하는 일대일 대응이란 뜻이기도 하다. 그렇다면 이 대응의 역함수는 무엇일까? 위에서의 논의를 생각해보면 역함수는 행렬 A A [LA(v)]C=A[v]B [L_{A} (v)]_{\mathfrak{C}} = A [v]_{\mathfrak{B}} 로 정의되는 선형 변환 LA L_A 에 대응시켜야 함을 알 수 있다.

추가적으로, 이 정리는 두 선형 변환의 합성 ML M \circ L 에 대응되는 행렬이 무엇인지도 알려준다. 선형 변환 L L M M 가 각각 행렬 A A , B B 에 대응된다고 할 때, BAx=B(Ax) BAx = B(Ax) 란 사실을 생각하면 LB L_B LA L_A 의 합성은 LBA L_{BA} 에 해당할 것임을 예측할 수 있으며, 따라서 ML M \circ L BA BA 에 대응될 것이다.

3.2. 진술

F F 위의 유한 차원 벡터 공간 V,W V, W 과 그 기저 B={v1,,vn} \mathfrak{B} = \left\{ v_1, \cdots, v_n\right\} , C={w1,,wm}\mathfrak{C} = \left\{ w_1, \cdots, w_m \right\} 가 주어져 있다고 하자.

그리고 함수 ΦCB:Mm,n(F)L(V,W) \mathsf{\Phi}_{\mathfrak{C}}^{\mathfrak{B}} : \mathfrak{M}_{m, n}(F) \rightarrow \mathfrak{L}(V, W) ΨCB:L(V,W)Mm,n(F) \mathsf{\Psi}_{\mathfrak{C}}^{\mathfrak{B}} : \mathfrak{L}(V, W) \rightarrow \mathfrak{M}_{m, n}(F) 를 다음과 같이 정의한다.
  • ΦCB(A)=LA \mathsf{\Phi}_{\mathfrak{C}}^{\mathfrak{B}} (A) = L_{A}, 여기서 LAL_A[LA(v)]C=A[v]B[L_{A}(v)]_\mathfrak{C} = A[v]_\mathfrak{B} 를 만족하는 L(V,W) \mathfrak{L}(V, W) 의 원소
  • ΨCB(L)=[L]CB \mathsf{\Psi}_{\mathfrak{C}}^{\mathfrak{B}} (L) = [L]_{\mathfrak{C}}^{\mathfrak{B}}

그러면 ΦCB\mathsf{\Phi}_{\mathfrak{C}}^{\mathfrak{B}}ΨCB\mathsf{\Psi}_{\mathfrak{C}}^{\mathfrak{B}}는 동형 사상이고 ΦCB=(ΨCB)1\mathsf{\Phi}_{\mathfrak{C}}^{\mathfrak{B}} = \left(\mathsf{\Psi}_{\mathfrak{C}}^{\mathfrak{B}}\right)^{-1} 이다.

또한, 유한 차원 벡터 공간 U U 와 그 기저 D={u1,,ur} \mathfrak{D} = \left\{ u_1, \cdots, u_r\right\} 를 추가로 생각하면 임의의 AMm,n(F) A \in \mathfrak{M}_{m, n}(F) , BMr,m(F) B \in \mathfrak{M}_{r, m}(F) 에 대해 LBA=LBLA L_{BA} = L_B \circ L_A[11]가 성립하고, 임의의 LL(V,W) L \in \mathfrak{L}(V, W) ML(W,U) M \in L(W, U) 에 대해 [ML]DB=[M]DC[L]CB [M \circ L]_{\mathfrak{D}}^{\mathfrak{B}} = [M]_{\mathfrak{D}}^{\mathcal{C}} [L]_{\mathfrak{C}}^{\mathfrak{B}} 가 성립한다.

4. 증명

아래 증명은 수식이 많아서 복잡하게 보일 수는 있으나, 사실상 선형변환과 행렬의 성질을 반복적으로 적용할 뿐인 기계적인 증명임을 생각하고 보면 크게 어렵지는 않을 것으로 생각된다.

4.1. 선형성

4.1.1. ΨCB\displaystyle \mathsf{\Psi}_{\mathfrak{C}}^{\mathfrak{B}} 는 선형변환

임의의 i{1,,n}\displaystyle i \in \left\{ 1, \cdots, n \right\} L,ML(V,W) L, M \in \mathfrak{L}(V, W) 에 대해
(L+M)(vi)=L(vi)+M(vi)\displaystyle (L+M)(v_i) = L(v_i) + M(v_i)
이므로,
[(L+M)(vi)]C=[L(vi)]C+[M(vi)]C [(L+M)(v_i)]_\mathfrak{C} = [L(v_i)]_\mathfrak{C} + [M(v_i)]_\mathfrak{C}
이다. 이로부터 행렬 [L+M]CB\displaystyle [L+M]_{\mathfrak{C}}^{\mathfrak{B}} i i 번째 열은 [L]CB[L]_{\mathfrak{C}}^{\mathfrak{B}} i i 번째 열과 [M]CB[M]_{\mathfrak{C}}^{\mathfrak{B}} i i 번째 열의 합임을 알 수 있다.

그러면 [L+M]CB=[L]CB+[M]CB\displaystyle [L+M]_{\mathfrak{C}}^{\mathfrak{B}} = [L]_{\mathfrak{C}}^{\mathfrak{B}} + [M]_{\mathfrak{C}}^{\mathfrak{B}} 가 되어
ΨCB(L+M)=ΨCB(L)+ΨCB(M)\displaystyle \mathsf{\Psi}_{\mathfrak{C}}^{\mathfrak{B}} (L+M) = \mathsf{\Psi}_{\mathfrak{C}}^{\mathfrak{B}} (L) + \mathsf{\Psi}_{\mathfrak{C}}^{\mathfrak{B}} (M)
이다.

또한, 임의의 cF c \in F 에 대해
[(cL)(vi)]C=c[L(vi)]C\displaystyle [(cL)(v_i)]_\mathfrak{C} = c[L(v_i)]_\mathfrak{C}
이므로 [cL]CB=c[L]CB [cL]_{\mathfrak{C}}^{\mathfrak{B}} = c[L]_{\mathfrak{C}}^{\mathfrak{B}} 가 되어
ΨCB(cL)=cΨCB(L)\displaystyle \mathsf{\Psi}_{\mathfrak{C}}^{\mathfrak{B}} (cL) = c \mathsf{\Psi}_{\mathfrak{C}}^{\mathfrak{B}} (L)
이다. 따라서 ΨCB\displaystyle \mathsf{\Psi}_{\mathfrak{C}}^{\mathfrak{B}} 는 선형 변환이다.

4.1.2. ΦCB \mathsf{\Phi}_{\mathfrak{C}}^{\mathfrak{B}} 는 선형변환

임의의 A,BMm,n(F) A, B \in \mathfrak{M}_{m, n}(F) vV v \in V 에 대해
[LA+B(v)]C=(A+B)[v]B=A[v]B+B[v]B=[LA(v)]C+[LB(v)]C\displaystyle [L_{A+B} (v)]_\mathfrak{C} = (A+B)[v]_\mathfrak{B} = A[v]_\mathfrak{B} + B[v]_\mathfrak{B} = [L_{A} (v)]_\mathfrak{C} + [L_{B} (v)]_\mathfrak{C}
이므로 LA+B(v)=LA(v)+LB(v)L_{A+B}(v) = L_{A}(v) + L_{B}(v) 가 되어 LA+B=LA+LB L_{A+B} = L_{A} + L_{B}이다. 즉,
ΦCB(A+B)=ΦCB(A)+ΦCB(B)\displaystyle \mathsf{\Phi}_{\mathfrak{C}}^{\mathfrak{B}} (A+B) = \mathsf{\Phi}_{\mathfrak{C}}^{\mathfrak{B}} (A) + \mathsf{\Phi}_{\mathfrak{C}}^{\mathfrak{B}} (B)
이다.

그리고 임의의 cF c \in F 에 대해
[LcA(v)]C=(cA)[v]B=c[LA(v)]C [L_{cA} (v)]_\mathfrak{C} = (cA)[v]_\mathfrak{B} = c[L_{A}(v)]_\mathfrak{C}
이므로 LcA(v)=cLA(v) L_{cA} (v) = cL_{A}(v) 가 되어 LcA=cLA L_{cA} = cL_A 이다. 즉,
ΦCB(cA)=cΦCB(A) \mathsf{\Phi}_{\mathfrak{C}}^{\mathfrak{B}} (cA) = c \mathsf{\Phi}_{\mathfrak{C}}^{\mathfrak{B}} (A)
이다. 따라서 ΦCB \mathsf{\Phi}_{\mathfrak{C}}^{\mathfrak{B}} 는 선형 변환이다.

4.2. 전단사

4.2.1. ΨCB \mathsf{\Psi}_{\mathfrak{C}}^{\mathfrak{B}} 는 전단사

우선 ΨCB \mathsf{\Psi}_{\mathfrak{C}}^{\mathfrak{B}} 가 전단사임을 확인하자. 먼저 단사임을 보이기 위해 ΨCB(L)=ΨCB(M)\displaystyle \mathsf{\Psi}_{\mathfrak{C}}^{\mathfrak{B}}(L)=\mathsf{\Psi}_{\mathfrak{C}}^{\mathfrak{B}}(M) L,ML(V,W) L, M \in \mathfrak{L}(V, W) 가 있다고 가정하자. 그러면 임의의 i{1,,n} i \in \left\{1, \cdots, n\right\} 에 대해 [L]CB [L]_{\mathfrak{C}}^{\mathfrak{B}}[M]CB [M]_{\mathfrak{C}}^{\mathfrak{B}} i i 번째 열이 같으므로 [L(vi)]C=[M(vi)]C [L(v_i)]_{\mathfrak{C}} = [M(v_i)]_{\mathfrak{C}} 이고, 따라서 L(vi)=M(vi) L(v_i) = M(v_i) 이다. 그런데 임의의 vV v \in V 를 택하면 B \mathfrak{B} V V 의 기저이므로 v=i=1ncivi v = \sum_{i=1}^{n} {c_i v_i} c1,,cnF c_1, \cdots, c_n \in F가 존재한다. 따라서
L(v)=L(i=1ncivi)=i=1nciL(vi)=i=1nciM(vi)=M(i=1ncivi)=M(v)\displaystyle L(v) = L\left(\sum_{i=1}^{n} { c_i v_i} \right) = \sum_{i=1}^{n} {c_i L(v_i)} = \sum_{i=1}^{n} {c_i M(v_i)} = M\left(\sum_{i=1}^{n} {c_i v_i} \right) = M(v)
이다. 즉, L=M L = M 이 되므로 ΨCB \mathsf{\Psi}_{\mathfrak{C}}^{\mathfrak{B}} 는 단사이다.

이제 ΨCB \mathsf{\Psi}_{\mathfrak{C}}^{\mathfrak{B}} 가 전사임을 보이기 위해서 임의의 AMm,n(F) A \in \mathfrak{M}_{m, n}(F)를 택하자. A A i i 번째 열을 [A]i [A]^i 로 표기하고 선형 변환 LL(V,W) L \in \mathfrak{L}(V, W) [L(vi)]C=[A]i [L(v_i)]_\mathfrak{C} = [A]^i 로 주면[12], [L]CB [L]_{\mathfrak{C}}^{\mathfrak{B}} i i 번째 열이 [A]i [A]^i 인 행렬이므로 [L]CB=A [L]_{\mathfrak{C}}^{\mathfrak{B}} = A 이다. 따라서 ΨCB \mathsf{\Psi}_{\mathfrak{C}}^{\mathfrak{B}} 는 전사이다.

4.2.2. ΦCB \mathsf{\Phi}_{\mathfrak{C}}^{\mathfrak{B}} 는 전단사

이제 ΦCB \mathsf{\Phi}_{\mathfrak{C}}^{\mathfrak{B}} 가 전단사임을 보이자. 먼저 단사임을 보이기 위해 ΦCB(A)=ΦCB(B)\displaystyle \mathsf{\Phi}_{\mathfrak{C}}^{\mathfrak{B}} (A) = \mathsf{\Phi}_{\mathfrak{C}}^{\mathfrak{B}} (B) A,BMm,n(F) A, B \in \mathfrak{M}_{m, n}(F)가 있다고 가정하자. 그러면 임의의 i{1,,n} i \in \left\{ 1, \cdots, n \right\} 에 대해 [LA(vi)]C=A[vi]B=Aei=[A]i [L_{A} (v_i)]_\mathfrak{C} = A[v_i]_\mathfrak{B} = A e_i = [A]^i 이고 마찬가지로 [LB(vi)]C=[B]i [L_{B} (v_i)]_\mathfrak{C} = [B]^i 이므로 A A B B 는 각각의 열이 같은 행렬이다. 즉, A=B A=B 이다. 따라서 ΦCB \mathsf{\Phi}_{\mathfrak{C}}^{\mathfrak{B}} 는 단사이다.

이제 ΦCB \mathsf{\Phi}_{\mathfrak{C}}^{\mathfrak{B}} 가 전사임을 보이기 위해 임의의 LL(V,W) L \in L (V, W) 를 택하자. 그리고 행렬 A A A=[[L(v1)]C[L(vn)]C] A = \begin{bmatrix} [L(v_1)]_\mathfrak{C} & \cdots & [L(v_n)]_\mathfrak{C} \end{bmatrix} 로 주면 [LA(vi)]C=A[vi]B=Aei=[A]i=[L(vi)]C [L_{A} (v_i)]_\mathfrak{C} = A[v_i]_\mathfrak{B} = A e_i = [A]^i = [L(v_i)]_\mathfrak{C} 이므로 LA(vi)=L(vi) L_{A} (v_i) = L (v_i) 이다. 따라서 위에서 보인 것과 마찬가지의 방법으로 LA=L L_A = L 임을 보일 수 있다. 그러므로 ΦCB \mathsf{\Phi}_{\mathfrak{C}}^{\mathfrak{B}} 는 전사이다.

4.3. 두 대응 간의 역함수 관계

임의의 LL(V,W) L \in L (V, W) vV v \in V 를 택하자. 그러면
[ΦCBΨCB(L)(v)]C=[ΦCB([L]CB)(v)]C=[L]CB[v]B=[L(v)]C\displaystyle [\mathsf{\Phi}_{\mathfrak{C}}^{\mathfrak{B}} \circ \mathsf{\Psi}_{\mathfrak{C}}^{\mathfrak{B}} (L) (v)]_\mathfrak{C} = [\mathsf{\Phi}_{\mathfrak{C}}^{\mathfrak{B}} ([L]_{\mathfrak{C}}^{\mathfrak{B}} ) (v)]_\mathfrak{C} = [L]_{\mathfrak{C}}^{\mathfrak{B}} [v]_\mathfrak{B} = [L(v)]_\mathfrak{C}
이므로 ΦCBΨCB(L)=L \mathsf{\Phi}_{\mathfrak{C}}^{\mathfrak{B}} \circ \mathsf{\Psi}_{\mathfrak{C}}^{\mathfrak{B}} (L) = L 이다. 따라서
ΦCBΨCB=idL(V,W)\displaystyle \mathsf{\Phi}_{\mathfrak{C}}^{\mathfrak{B}} \circ \mathsf{\Psi}_{\mathfrak{C}}^{\mathfrak{B}} = \mathrm{id}_{L (V, W)}
이다.

반대 방향을 보이기 위해 임의의 AMm,n(F) A \in \mathfrak{M}_{m, n}(F) 를 택하자. 그러면 ΨCBΦCB(A) \mathsf{\Psi}_{\mathfrak{C}}^{\mathfrak{B}} \circ \mathsf{\Phi}_{\mathfrak{C}}^{\mathfrak{B}} (A) i i 번째 열은 [ΦCB(A)(vi)]C=A[vi]B=Aei=[A]i [ \mathsf{\Phi}_{\mathfrak{C}}^{\mathfrak{B}} (A) (v_i) ]_\mathfrak{C} = A[v_i]_\mathfrak{B} = A e_i = [A]^i 이다. 즉, ΨCBΦCB(A) \mathsf{\Psi}_{\mathfrak{C}}^{\mathfrak{B}} \circ \mathsf{\Phi}_{\mathfrak{C}}^{\mathfrak{B}} (A) A A 는 각각의 열이 같은 행렬이므로 같은 행렬이다. 따라서
ΨCBΦCB=idMm,n(F) \mathsf{\Psi}_{\mathfrak{C}}^{\mathfrak{B}} \circ \mathsf{\Phi}_{\mathfrak{C}}^{\mathfrak{B}} = \mathrm{id}_{\mathfrak{M}_{m, n}(F)}
이다.

4.4. 합성과 곱의 관계

임의의 LL(V,W) L \in \mathfrak{L}(V, W) ML(W,U) M \in \mathfrak{L}(W, U) 를 택하고 P=[L]CB P = [L]_{\mathfrak{C}}^{\mathfrak{B}} , Q=[M]DC Q = [M]_{\mathcal{D}}^{\mathfrak{C}} 라 하자. P=(aij)m×n P = \left(a_{ij} \right)_{m\times n} 라고 하면, 임의의 k{1,,n} k \in \left\{1, \cdots, n\right\} 에 대해
Q[P]k=i=1maik[Q]i=i=1maik[M(wi)]D=[i=1maikM(wi)]D=[M(i=1maikwi)]D=[M(L(vk))]D\displaystyle Q[P]^k = \sum_{i=1}^{m} {a_{ik} [Q]^i} = \sum_{i=1}^{m} {a_{ik} [M(w_i)]_\mathcal{D} } = \left[ \sum_{i=1}^{m} {a_{ik} M(w_i)} \right]_\mathcal{D} = \left[ M \left( \sum_{i=1}^{m} { a_{ik} w_i } \right) \right]_{\mathcal{D}} = \left[M(L(v_k)) \right]_{\mathcal{D}}
이다. 따라서 QP QP k k 번째 열은 [(ML)(vk)]D [(M \circ L) (v_k)]_\mathcal{D} 이다. 즉, QP QP [ML]DB [M \circ L]_{\mathcal{D}}^{\mathfrak{B}} 는 모든 열이 같으므로 같은 행렬이다. 결국
[ML]DB=[M]DC[L]CB [M \circ L]_{\mathcal{D}}^{\mathfrak{B}} = [M]_{\mathcal{D}}^{\mathfrak{C}} [L]_{\mathfrak{C}}^{\mathfrak{B}}
이다.

이제 후자를 증명하기 위해서 임의의 AMm,n(F) A \in \mathfrak{M}_{m, n}(F) BMr,m(F) B \in \mathfrak{M}_{r, m}(F) , vV v \in V 를 택하자. 그러면 [LBA(v)]D=BA[v]B=B[LA(v)]C=[LB(LA(v))]D [L_{BA} (v)]_\mathcal{D} = BA[v]_\mathfrak{B} =B[L_{A} (v)]_\mathfrak{C} = [L_B ( L_A (v) ) ]_\mathcal{D} 이므로 LBA(v)=(LBLA)(v) L_{BA}(v) = (L_{B} \circ L_{A}) (v) 가 성립해
LBA=LBLA L_{BA} = L_{B} \circ L_{A}
이다.

5. 기저의 변환

선형 변환의 행렬 표현은 어떤 기저를 택했냐에 따라 바뀔 수 있음을 유의해야 한다. 예를 들어, L:R2R3 L : \mathbb{R}^2 \rightarrow \mathbb{R}^3 L(x,y)=(x+2y,xy,2xy) L(x, y) = (x+2y, x-y, 2x-y)로 정의될 때, 표준 기저 E={(1,0),(0,1)}, \mathcal{E} = \left\{(1, 0), (0, 1)\right\}, F={(1,0,0),(0,1,0),(0,0,1)}\mathcal{F} = \left\{(1, 0, 0), (0, 1, 0), (0, 0, 1)\right\} 에 대해서는 [L]FE= [L]_{\mathcal{F}}^{\mathcal{E}} = [121121] \begin{bmatrix} 1 & 2 \\ 1 & -1 \\ 2 & -1 \end{bmatrix} 이지만 E={(1,1),(1,1)}, \mathcal{E}^* = \left\{ (1, 1) , (1, -1) \right\}, F={(1,0,0),(1,1,0),(1,1,1)}\mathcal{F}^* = \left\{ (1, 0, 0), (1, 1, 0), (1, 1, 1) \right\} 에 대해서는 [L]FE= [L]_{\mathcal{F}^*}^{\mathcal{E}^*} = [331113] \begin{bmatrix} 3 & -3 \\ -1 & -1 \\ 1 & 3 \end{bmatrix} 이다.

그렇다면 다른 기저가 사용되었을 때 행렬 표현은 어떻게 바뀔까? 체 F F 위의 벡터 공간 V V W W 가 있고 이 두 벡터 공간이 각각 기저 B,B \mathfrak{B}, \mathfrak{B}^* C,C \mathfrak{C}, \mathfrak{C}^* 를 가지며 선형 변환 L:VW L : V \rightarrow W 이 주어져 있다고 하자. 그러면 L=IWLIV L = I_{W} \circ L \circ I_{V} [13]이므로
[L]CB=[IW]CC[L]CB[IV]BB [L]_{\mathfrak{C}^*}^{\mathfrak{B}^*} = [I_W]_{\mathfrak{C}^*}^{\mathfrak{C}} [L]_{\mathfrak{C}}^{\mathfrak{B}} [I_V]_{\mathfrak{B}}^{\mathfrak{B}^*}
임을 알 수 있다. 이때, [IV]BB [I_V]_{\mathfrak{B}^*}^{\mathfrak{B}} 와 같은 형태의 행렬을 (B\mathfrak{B}에서 B\mathfrak{B}^*로의) 추이 행렬(transition matrix)이라 부르며, [IV]BB[IV]BB=[IV]BB=I [I_V]_{\mathfrak{B}}^{\mathfrak{B}^*} [I_V]_{\mathfrak{B}^*}^{\mathfrak{B}} = [I_V]_{\mathfrak{B}}^{\mathfrak{B}} = I 이므로 [IV]BB=([IV]BB)1[I_V]_{\mathfrak{B}}^{\mathfrak{B}^*} = ([I_V]_{\mathfrak{B}^*}^{\mathfrak{B}})^{-1} 가 되어 가역 행렬임을 알 수 있다.

이때, 만약 V V W W 가 같고 B=C \mathfrak{B} = \mathfrak{C} , B=C \mathfrak{B}^* = \mathfrak{C}^* 이면 특히 [L]BB=[IV]BB[L]BB[IV]BB [L]_{\mathfrak{B}^*}^{\mathfrak{B}^*} = [I_V]_{\mathfrak{B}^*}^{\mathfrak{B}} [L]_{\mathfrak{B}}^{\mathfrak{B}} [I_V]_{\mathfrak{B}}^{\mathfrak{B}^*} =[IV]BB[L]BB([IV]BB)1 = [I_V]_{\mathfrak{B}^*}^{\mathfrak{B}} [L]_{\mathfrak{B}}^{\mathfrak{B}} ( [I_V]_{\mathfrak{B}^*}^{\mathfrak{B}}) ^ {-1} 가 되어 두 행렬 [L]BB [L]_{\mathfrak{B}^*}^{\mathfrak{B}^*} [L]BB [L]_{\mathfrak{B}}^{\mathfrak{B}} 상사 관계에 있음을 알 수 있다. 이 때문에 정의역과 공역이 같은 선형 변환의 대각합이나 행렬식 등을 정의할 수 있다. 대각합이나 행렬식을 행렬 표현의 대각합이나 행렬식으로 정의하면 되고, 이 값들은 상사 관계에 있는 행렬끼리는 항상 같기 때문에 행렬 표현이 달라진다고 선형 변환의 대각합이나 행렬식 값이 달라지진 않기 때문이다.

6. 같이 보기



[1] 이런 일대일 대응 함수를 가군 동형 사상이라고 한다. 물론 고작 동형사상 정도일 뿐만이 아니라 동형인 함자(functor)로 보는 게 더 자연스럽긴 하지만, 이를 정확히 얘기하는 것은 본 문서 수준 외의 내용이다.[2] Gilbert Strang, Linear Algebra and Its Applications, Brooks[3] 첨언하자면, 영어판 위키백과에는 이런 기본정리라는 간판을 걸어놓은 정리들을 망라한 목록이 있다. 가장 유명한 미적분의 기본정리를 비롯해 산술의 기본정리, 선적분의 기본정리, 대수학의 기본정리, 곡선의 기본정리, 유한생성가환군의 기본정리, 갈루아 이론의 기본정리, 비가환대수학의 기본정리, 리만기하학의 기본정리, 사영기하학의 기본정리 등 수학 전공자라면 한번쯤 들어봄직한 기본정리들부터 후생경제학의 기본정리, 자연선택의 기본정리, 포커의 기본정리 등 다른 전공에서나 들어봄직한 기본정리나 Fundamental 'Lemma'들까지 다양한 분야에 걸쳐 많기도 많다. 하지만 여기 있는 기본정리들 중에도 책에 따라서는 기본정리라는 거창한 타이틀 없이 등판하는 기본정리들이 의외로 좀 있다. 사실 기본정리 중 가장 유명하다는 미적분의 기본정리조차도 FTC1, FTC2가 소개되는 순서가 교재마다 일정치 않은 판이니...[4] 관습적으로 Fn F^n 의 원소들은 모두 열 벡터로 취급하기 때문에 공간을 덜 차지하기 위해 가로로 적고 전치(transpose) 연산자 tt 를 붙였다.[5] eie_i는 i번째 좌표만 1이고 나머지 좌표는 모두 0인 벡터이므로[6] 프리드버그 선형대수학 교재에서는 '순서기저(ordered basis)'라는 명칭을 따로 붙여 놓았다.[7] 무한 차원 행렬이 정의되지 않았으므로 무한 차원인 경우는 생각하지 않는다[8] 이 문서의 표기는 이인석의 선형대수와 군을 따른다. Friedberg의 교재에는 이 문서와는 정 반대로 정의역의 기저 쪽이 아래로 내려가도록 표기하고 있으니 주의.[9] 기저의 성질을 생각해보면 각각의 계수들은 유일하게 결정되므로 같은 기저에 대해 한 벡터가 여러 좌표를 가질 수는 없다[10] 벡터를 그 좌표 표현에 대응하는 변환은 당연히 선형 변환이다[11] 엄밀히 말하자면 LA L_A , LB L_B , LAB L_{AB} 대신 ΦCB(A) \mathsf{\Phi}_{\mathfrak{C}}^{\mathfrak{B}} (A) , ΦDC(B) \mathsf{\Phi}_{\mathcal{D}}^{\mathfrak{C}}(B), ΦDB(BA) \mathsf{\Phi}_{\mathcal{D}}^{\mathfrak{B}} (BA) 를 써야한다. 세 함수는 모두 정의역, 공역이 전혀 다르기 때문이다. 혼동의 여지는 전혀 없으므로 큰 문제는 아니다.[12] 선형 변환의 선형성에 의해 선형 변환을 정의하는 것은 기저에서의 값을 정의하는 것만으로도 충분하다. 또한 벡터와 그 좌표를 대응하는 것은 당연하게 일대일 대응일 것이므로(기저의 정의에 의해) 선형 변환 값을 좌표 값으로 대신 주더라도 잘 정의될 것이다.[13] 단, IVI_V IWI_W 는 각각 V V W W 위에서의 항등 사상을 의미한다