상대성 이론 Theory of Relativity | |||
{{{#!wiki style="margin:0 -10px -5px" {{{#!wiki style="word-break: keep-all;" {{{#!folding [ 펼치기 · 접기 ] {{{#!wiki style="margin:-6px -1px -11px" | <rowcolor=#2A1A5B> | 특수 상대성 이론 | 일반 상대성 이론 |
<colcolor=#00a0de><colbgcolor=#2A1A5B> 배경 | 상대성 이론/역사 · 맥스웰 방정식 · 마이컬슨-몰리 실험 | ||
기초 가설 | 상대성 원리 · 광속 불변의 원리 | 등가 원리(중력 · 관성력) | |
이론 체계 | 시공간(세계선 · 고유 시간 · 고유 길이 · 민코프스키 다이어그램 · 아인슈타인 표기법) · 미분기하학(리만 다양체) | ||
로런츠 변환(로런츠 인자) · 로런츠 군 | 아인슈타인 방정식 · 힐베르트 액션 (슈바르츠실트 계량 · 라이스너-노르드스트룀 계량 · 커 계량/커-뉴먼 계량) | ||
현상 | 동시성의 상대성 · 시간 지연 · 길이 수축 · 질량-에너지 등가원리 · 상대론적 효과(도플러) | 중력 렌즈 효과 · 중력파 · 적색편이 | |
응용 및 심화 | 기본 상호작용 · 상대론적 역학 · 상대론적 전자기학 · 양자 전기역학 · 천체물리학(천문학 둘러보기) · 통일장 이론 · 루프 양자 중력 이론 · 타임 패러독스 · 중력 자성 | ||
쌍둥이 역설 · 막대와 헛간 역설 · 아광속 · 초광속 · 타키온 | 중력자 · 블랙홀(블랙홀 둘러보기 · 사건의 지평선 · 중력 특이점 · 양자블랙홀) · 우주론 · 우주 상수 | }}}}}}}}}}}} |
1. 핵심 요약
특수 상대성 이론은 아인슈타인의 골머리를 앓게 한 몇 가지 문제를 가지고 있었다.- 자와 시계의 문제.
- 아인슈타인은 그의 특수 상대성 이론 논문에서 운동학과 동역학 부분을 나눠서 설명했다. 즉, 서로 등속 운동하는 자(ruler)와 시계가 어떤 관계를 가지고 변환되는지에 대한 법칙을 먼저 다루고, 이것을 바탕으로 맥스웰의 전자기학을 다루었던 것이다.
- 그러나 자와 시계 역시 그것을 구성하고 있는 원자들이 서로 전자기력을 주고받으며 응집되어 있는 물질계였기 때문에 그것의 물리적인 거동을 미리 가정한 채 물리 법칙을 기술하는 것은 결함이 있는 설명이었던 것이다. 아인슈타인은 특수 상대성 이론을 발표한 이후에 이 문제를 또렷이 인식했다.
- 관성계의 우월함.
- 태양계 자체의 운동이나 지구의 공전, 자전을 고려해봤을 때, 인간이 경험하고 있는 자연은 관성계에서의 기술이 아니다. 그럼에도 불구하고, 인간은 물리학을 세울 수 있었고 법칙을 알아낼 수 있었다. 이런 경험적인 고찰과 더불어 자연이 어느 특수한 관측계를 선호해야 할, 또는 그렇게 보아야 할 충분한 이유가 없다 [1]. 따라서 물리 법칙은 가속하는 관측계에서도 똑같이 기술되어야 한다.
- 그런데 위의 '자와 시계 문제'와 결부시켜 생각해보면 상황은 매우 복잡해진다. 가속되는 자(ruler)의 원자 배열이 힘(특히, 전자기력)을 받지 않는 자(ruler)의 원자 배열과 다를 것이고 얼마나 다른지 쉽게 기술할 수 없다. 왜냐하면 외부에서 자를 이루는 원자에게 가하는 전자기장의 크기가 제각각이기 때문이다 (반면, 관성계는 모두 0임을 전제). 즉, 가속되는 자의 거시적 거동은 단순히 좌표 변환 규칙으로 표현될 수 없고 동역학 법칙을 표현하는 미분방정식을 풀어서 그 해를 구해야 하는 문제인 것이다.
- 따라서 가속계를 포섭하기 위해서는 '자와 시계로 재는 좌표'를 포기하고 수학적으로 추상적인 좌표를 도입해야 한다 (또한 1번 문제도 자연스럽게 해결된다). 이 수학적으로 추상적인 좌표는 물리적인 의미를 전혀 가지지 않으므로 모든 물리 법칙은, 이런 좌표 의미에서, 수학적으로 가능한 모든 좌표계에서 동일하게 기술되어야 한다. 어렵게 말하면 물리법칙은 일반적인 좌표 공변성(General covariance)을 가져야 한다.
- 동시성의 문제.
- 이미 당대 저명한 수학자 앙리 푸앵카레가 언급한 바와 같이 공간적으로 떨어진 두 사건 사이의 시간적 순서는 물리적으로 본질적인 의미를 가지지 않음[2]을 아인슈타인은 이해하고 있었다. 특수 상대성 이론에서는 공간적으로 떨어져 있지만 서로에 대하여 정지한 시계들 사이에 빛 신호를 기준으로 '동시'를 규약했었다. 아인슈타인은 다름이 아니라 하필 빛을 기준으로 동시를 규약해야 할 충분한 이유가 없음을 알고 있었고, 동시란 개념을 완전히 없애려고 했다. 따라서 뉴턴 중력의 즉각적인 전파는 그의 이론에서 허용되지 않는 것이었다. 즉, 중력 역시 전자기장처럼 시공간상에 분포되어있는 장(field)으로 표현되어야 했다.
그 어느 것도 쉬운 문제가 아니며 완전 제각각으로 보이는 문제로 보인다. 하지만 아인슈타인은 이 문제를 완전히 풀었다. 위의 문제들과 함께 언급된 아인슈타인의 물리학적 고찰[3]에 따라 '일반적인 좌표 공변성'은 이론이 지켜야 할 원리로 강제되었으며, 이것은 리만 기하학이란 수학적 도구에 의해 실현되었다.
리만 기하학을 이해하려면 기하학에 대한 근본적인 관념들이 수정되어야 하는데, 미적분과 내적이 그것이다. 그런데 좌표 변환이 일반적인 좌표 변환으로 확장되는 것과 그에 맞추어 미적분과 내적이 수정되는 걸 보면 사실 그 형태가 미분 기하학, 특히 리만 기하학[4]에서 연구된 것과 유사하다는 것을 알 수 있다. 여기에서 휘어진 시공간이 도입될 틈이 생긴 것이다.
이 모든 것을 푸는 단서는 등가 원리에 있다. 등가 원리의 요지는 중력과 가속도는 구분이 안 된다는 것이다.[5] 시점을 바꿔 말하자면 자유 낙하하는 관찰자의 좌표계는 관성 좌표계와 같다는 것이다. 예를 들어 자유 낙하하는 엘리베이터 안에 있는 사람은 자신이 떨어지고 있는 것인지 아니면 우주 공간에 둥둥 떠 있는 것인지 알 수가 없다. 다만 조석력 등 몇 가지 문제가 있는데, 이런 문제는 각 점마다 매우 좁은 영역에서 근사적으로 이런 등가 원리가 성립한다는 식으로 설명할 수 있다. 더 정확하게는 시공간의 모든 지점에서 적당한 좌표 변환에 의하여 국소적으로 비-중력 물리법칙이 특수 상대성 이론의 형태를 가지게 할 수 있다는 사실이다. 이 설명에서 중력이 슬그머니 빠졌다는 것을 기억하자. 이 등가원리의 역할[6]이 뭐냐면 (전체 영역에서는 우리가 잘 모르는 일이 일어나더라도) 천문학적으로 충분히 작은 영역에서 우리가 이미 알고 있는 물리학의 법칙들이 특수 상대성 이론의 형태를 가지는 근거를 마련하는 것이다.
이렇게 로렌츠 변환에서 불변이던 물리 법칙을 리만 기하학의 언어를 동원해 일반적인 좌표 변환에서도 불변이도록 바꾸면 희한한 일이 벌어진다. 이런 상황에서 벡터들 간의 내적은 보다 일반적인 내적으로 수정이 되어야 한다. 식으로는 다음과 같이 주어진다.
[math(\displaystyle \vec{v} \cdot \vec{w} = \sum_{i = 0}^3 \sum_{j = 0}^3 g_{ij} v_i w_j)] [7]
여기서 [math(g_{ij})]를 메트릭 텐서라고 부른다. 평평한 시공간에서 메트릭 텐서는 [math(g_{00} = 1)], [math(g_{ii} = -1)] ([math(i = 1, 2, 3)]), [math(g_{ij} = 0)] ([math(i \ne j)])으로 주어진 것을 확인할 수 있을 것이다. (이 말이 일반 상대성 이론에서도 통하는 이유 역시 등가 원리 때문이다.) 하지만 일반적인 시공간에서는 그렇다고 장담 못 한다. 평평하더라도 말이다. 당장 원통 좌표계나 구면 좌표계만 하더라도 메트릭 텐서는 저런 상수 꼴이 아니다. 휘어진 시공간에서는 말할 것도 없겠다. 심지어 메트릭 텐서는 일반적으로 시간에 대해서도 함수다. 이러한 성질들은 메트릭 텐서가 사실 시공간의 구조를 결정해 주는 물리량이라는 것을 말해 준다.
한편, 모든 물리 법칙들을 표현하는 식에는 벡터들이 항상 들어간다. 그리고 그 벡터들의 내적이 반드시 포함된다. 그렇지 않은 경우는 없다고 보면 된다. 따라서 모든 물리 법칙은 내적을 가지고 있다는 건데, 그 내적은 메트릭 텐서를 포함하고 있으므로 모든 물리 법칙에는 메트릭 텐서가 포함되어 있고 그 수학적인 표현을 보면 모든 물질이 메트릭 텐서와 최소 한 번은 결합되어 있다는 것을, 즉 엮여 있다는 것(coupling)을 볼 수 있다. 그런데 수학적으로 엮여있으면 일반적으로 두 물리량 간에 어떤 상호작용이 있다는 것을 의미한다. 이 말에 따르면 물질들과 메트릭 텐서는 상호작용을 한다는 것으로 쓸 수 있겠다. 한편 물리학에서 시공간에 대해 변화가 일어나는 물리량은 항상 그 물리량만의 동역학(dynamics)을 가진다. 메트릭 텐서도 예외일 수 없다. 그리고 그 동역학은 다른 것들과의 상호작용 또한 포함하는 식으로 완성된다. 따라서 메트릭 텐서는 시간과 공간에 대해 변하며, 어떻게 변하는가는 물질(의 분포)에 의하여 결정된다. 마치 전자기장이 전하-전류 분포에 의하여 결정되는 것처럼 메트릭 텐서도 물질 분포에 의하여 결정된다는 것이다. 그런데 앞서 말했듯이 메트릭 텐서는 시공간의 구조를 결정해 준다고 했었다. 결국 우리는 다음 결론을 얻는다.
물질의 분포가 시공간의 휘어짐을 결정한다.
특수 상대성 이론의 로렌츠 불변성을 일반적인 좌표 변환에 대한 불변성으로 확장하였더니 이런 결과가 갑툭튀했다. 그리고 이러한 결과를 수학적으로 잘 계산하면 중력은 시공간의 휘어짐에 따른 결과이다라는 것을 유도할 수 있다. 게이지 변환을 통해 맥스웰 방정식이 갑툭튀하는 것과 유사하다.(게이지 변환 : 전자기장 유도 참고) 결론을 지어 말하자면 특수 상대성 이론의 일반화는 자동으로 중력을 포함한다. 즉, 왜 물질이 서로 끌어 당기는가 하는 이유가 완전히 설명된 것이다.
아인슈타인이 위대하다고 칭송 받는 이유가 바로 이것이다. 정말 최소한의 가정으로 삼라만상을 지배하는 물리 법칙들이 필연적인 이유를 갖는다는 것을 밝힌 것이다. 이러한 원리는 후대의 이론 물리학자들이 두고두고 써먹게 되며, 일반적인 게이지 장, 즉 양-밀스 장 이론도 이런 식으로 튀어 나오게 된다.
2. 가정
일반 상대성 이론은 중력-가속도 등가(등가원리)로부터 시작한다. 곧, 중력과 가속도는 구별할 수 없다는 뜻이다.그런데 이 등가원리를 곧이곧대로 받아들이기에는 문제가 너무 많다. 다음은 그 몇 가지 예이다.[8]
- 가속을 받는 물체와 나란한 (비관성)계에서 가속의 효과를 '장'으로 표현하자면, 그 크기가 우주 끝까지 가도 0이 되지 않는다. 반면 중력은 무한히 멀어질수록 0으로 접근한다.
- 중력에는 있는 조석력[9]이 비관성계에서는 어떻게 해도 나오지 않는다.
이러한 문제가 있지만, 그렇다고 해결 못하는 건 아니다. 약간의 제약을 둠으로써 등가원리를 제대로 쓸 수 있게 된다. 헌데, 제약을 주는 방법도 하나만 있는 건 아니다.
- 그냥 '중력과 가속도는 구별이 안 된다'라고 하는 건 모든 공간에서 그렇다라고 주장하는 걸 내포한다. 이를 축소시켜, '충분히(아주) 작은 영역에서' 중력과 가속도는 구별이 안 된다라고 주장하면 위의 문제들이 모두 해결된다.[10]
- 다 갖다 버리고, 그냥 관성질량과 중력질량이 같다고만 한다.[11]
그리고 이 가정들 각각으로부터 출발하여 일반상대론을 구축할 수 있다![12] 정말 신기한 건, 어느 방법을 택하든, 결과는 똑같다는 것.[13]
물리학자들은 일반상대론이 물리학 이론들 중에서 가장 아름다운 이론이라고 평가하는데, 그 이유 중 하나가 바로 아주 간단하고도 대담한 몇몇 가정(특수상대론의 가정들+등가원리[14])들만 가지고 온 우주에 성립하는 법칙을 수학적으로 '유도'해 냈다는 점에 있다. 즉, 순수하게 인간의 논리적 사유만으로 자연의 거대한 법칙 중 하나가 덜컥 나왔다는 것이다. 예컨대 뉴턴의 운동법칙과 중력 이론, 맥스웰 방정식 등은 수많은 실험과 관찰에서 찾아낸 '패턴'을 통해 알아낸 것이기에 인간의 사유만으로 얻어진 산물은 아니었다.[15] 하지만 아인슈타인은 쇼파에 털썩 앉을 때 들었던 그 아이디어[16]로부터, 그것도 관성질량과 중력질량이 같을 것 같다는 것 외엔 어떠한 실험적 데이터도 없이[17] 출발하여 전 우주를 지배하는 중력의 이론을 만들어낸 것이다. 그리고 우리가 알다시피 이 이론은 우리의 우주를 아주 잘 설명해 주고 있다. 이는 인류 역사상 단 한 번도 일어난 적이 없었던 사건으로, 인류 지성의 위대한 승리라고 할 만한 일이다. 이것만 봐도 일반상대론이 가장 아름다운 이론이라고 칭송받을 만하다는 걸 알 수 있다.[18] 그 이후로, 논리적 사유를 최대한 이용하여 물리 법칙을 이끌어내려는 시도가 여러 차례 있었으며, 그 결과로 나온 것 중에 디랙 방정식과 양자전자기역학[19], 그리고 초끈이론이 있다.
2.1. 등가원리: 시공간은 휘어져 있을 것이다
등가원리를 자세히 살펴 보자. 아인슈타인의 생각대로라면 사실 자유 낙하하는 물체는 자신이 낙하하고 있다는 것을 모를 것이다. 예를 들어 위에서 든 연구실을 다시 가져오되, 이번엔 연구실을 벽으로 둘러 싸 안에서 바깥을 아예 볼 수 없도록 만들었다고 하자. 이제 이 연구실을 공기저항 없이 지표면 근처에서 자유 낙하시키자. 그러면 이 연구실 안에서 일어나는 일은 연구실이 주변에 아무 것도 없는 텅 빈 우주 공간에 놓여 있을 때 일어나는 일과 전혀 다를 게 없다는 것이 아인슈타인의 등가원리인 것이다. 즉, 떨어지는 엘리베이터 안의 사람은 (엘리베이터가 다 닫혀 있을 때) 자신이 자유 낙하하고 있는 중인지 아니면 우주 공간에 떠 있는지 구분할 수 없다는 것이다.가만 보면 이 역시 우리의 상식에 벗어나 보인다. 사실 우리는 떨어지는 것을 느낄 수 있다...고 생각하고 있다. 자유 낙하까진 아니더라도 바이킹이나 롤러 코스터 혹은 번지 점프 같은 걸 즐길 때 그 느낌은 지표면에 발을 붙이고 있을 때와 다르다. 그래서 우리는 낙하하고 있는지 아닌지를 알 수 있을 것 같다. 하지만 더 깊게 생각해 보면 그렇지 않다는 것을 알 수 있다. 우리가 지표면에 발을 붙이고 있을 때에는 내장 등의 조직들이 축 늘어져 있는 상태다. 그리고 우리 몸은 이런 상태에 익숙해져 있는 상태다. 이 상태에서 자유 낙하를 하면 그런 조직의 늘어짐이 풀릴 테고 우리는 그것을 느끼는 것이다. 하지만 이러한 풀림은 중력이 없는 공간에서도 그대로 생길 것이다. 즉, 자유 낙하를 할 때와 중력이 없는 공간에 놓여 있을 때 우리 몸이 느끼는 것은 완전히 똑같다.[20]
이 사실을 물리학적으로 이렇게 볼 수 있다. 자유 낙하하는 물체의 좌표계는 관성 좌표계와 다를 게 없다는 것이다. 지표면에 붙어 있는 관찰자의 좌표계가 아닌, 자유 낙하하는 관찰자의 좌표계가 말이다. 이 논리대로라면 사실 지표면에 붙어있는 관찰자의 좌표계는 (관성력에 의한) 비관성 좌표계인 셈이다. 이 역시 우리의 상식에서 벗어나 보인다. 하지만 이러한 인식의 전환이 상대성 원리를 더 일반적인 케이스로 확장시키는 데 있어서 지대한 공헌을 해 준다.
여기에서 하나 재밌는 걸 볼 수 있다. 자유 낙하하는 실험실 안에서 벌어지는 일은 텅 빈 우주 공간 속에서 일어나는 일과 다를 게 없다고 했다. 그러면 이 안에서 레이저를 쐈을 때 그 빛은 직진할 것이다. 그런데 이걸 지표면에서 본다면 이야기가 달라진다. 안에서 봤을 때 빛이 직진하는 것으로 보이려면 바깥에서는 그 빛이 실험실과 같이 '낙하'하고 있어야 한다는 것을 알 수 있다. 즉, 빛이 휘어져서 진행하는 것으로 보일 것이다. 중력의 영향을 받지 않을 것으로 여겼던 빛은 등가원리를 놓고 봤을 때 어느 좌표계에서 봤을 때 휘어진다는 것이다. 그런데 이것은 가만 생각해 보면 그리 놀라운 게 아니다. 예를 들어 돌고 있는 회전 목마에 카메라를 설치해 놓고 그 카메라로 바깥에 서 있는 한 사람이 쏘는 레이저 빛을 촬영한다고 해 보자. 이 카메라에 촬영된 빛은 휘어져서 진행하는 것처럼 보일 것이다. (만약 주변에 아예 아무것도 없다면 영상만 봤을 때 카메라가 움직이고 있다는 것조차 모를 테니 정말 그렇게 보일 것이다.) 사실 이 현상과 중력에 의하여 빛이 휘어져 보이는 것은 다를 게 없는 현상이다. 둘 다 비관성 좌표계에서 빛을 본 것이기 때문에 벌어지는 현상이기 때문이다. 어쨌든 이 역시 상식과 어긋나 보이는 현상이긴 하지만...
진짜 이상한 것은 따로 있다. 앞서 등가원리에 따라 자유 낙하하는 실험실 안의 일은 팅 빈 우주 공간에 있을 때 벌어지는 일과 구분이 안 간다고 했었다. 만약 지표면이 무한히 넓고 평평하다면 이 말이 완전히 맞을 것이다. 하지만 실제 지구는 둥글고, 그로 인해 위에서 설명한 것이 완전히 맞아 떨어지지는 않는다. 조석력(tidal force)이 바로 그 원인이다. 다음 그림을 보자.
왼쪽 그림은 (오른쪽에 있는)다른 천체로 인해 해당 천체가 받는 중력을 표시한 것이다. 아이작 뉴턴의 중력 법칙에 따르면 중력은 거리의 제곱에 반비례한다. 따라서 위 그림의 세 화살표가 위치한 각 지점에서 중력의 크기는 각기 다 다를 것이다. 이러한 차이는 천체의 좌표계(천체와 나란히 움직이는 관찰자가 봤을 때의 좌표계)에서도 드러난다. 이는 오른쪽 그림처럼 구가 양 옆으로 쭈욱 잡아당겨지는 힘을 받는 것으로 나타날 것이다. 이것이 바로 조석력이다. 그리고 조석력은 관성 좌표계에서 나타나지 않는 것이다.
이걸 놓고 보면 등가원리가 틀린 것으로 보일 것이고, 보통 사람들이었다면 등가원리를 버렸을 것이다. 하지만 아인슈타인은 달라도 너무나도 달랐다. 그는 이렇게 또 한 번 발상의 전환을 시도했다. 등가원리는 여전히 옳다. 다만 시공간이 휘어진 것이다.[21] 이러한 발상의 전환이 상대성 이론의 확장을 가능케 했던 것이다.
등가원리에 대한 대강의 설명은 끝났다. 이제 남은 것은 상대성 이론을 확장시키는 것이다.
3. 상대성 원리의 확장
3.1. 벡터와 텐서
상대성 이론으로 돌아가자. 한 가지 필요한 것이 있다. 먼저 바로 위에서 설명한 것들을 모조리 잊어 버리는 것이다. 심지어 중력이 존재한다는 것마저! 즉 지금 우리는 중력이란 게 있는지도 모른다고 친 상태다. 다만, 두 가지는 남겨 두자. 하나는 등가원리 그 자체인데, '중력'(자유 낙하) 같은 것 없이 이를 표현한다면 이렇게 표현할 수 있을 것이다. '어느 물리 시스템이든 적당한 좌표계가 존재하여 이 좌표계는 각 점의 (좁은) 근방에서 근사적으로 관성 좌표계와 같다.' 그리고 또 하나는 시공간이 휘어져 있을지도 모른다는 생각이다.[22] 이 두 가지를 가지고 상대성 이론을 확장시키자. 그리고 이렇게 했을 때 우리가 잊어 버렸던 중력이 어떻게 돌아오는가를 보도록 하겠다.특수 상대성 이론에서는 관성 좌표계 간의 좌표 변환을 다뤘었다. 이때 이들 좌표계는 모두 시간축 + 데카르트 좌표계로 기술되었다. 그런데 좌표 변환이라는 게 그런 것만 있진 않다. 예컨대 데카르트 좌표계에서 구면 좌표계로의 좌표 변환도 가능하다. 그리고 이러한 좌표 변환을 하고 나서 물리 법칙을 다뤄도 잘 작동한다는 것을 우리는 잘 안다. 당장 쿨롱의 법칙으로 쌍극자 모멘트를 계산하려고 할 때에도 거의 항상 구면 좌표계에서 다루고 있지 않은가. 바로 여기에서 일반 상대성 이론이 출발한다. 일반 상대성 이론은 이러한 일반적인 좌표 변환에서도 물리 법칙들이 불변할 것을 요구한다.
먼저 일반적인 좌표 변환에 불변한다는 것이 무엇인지부터 따져 보자. 이제부터는 아인슈타인 합 규약을 사용하기 시작하고, 특수 상대성 이론에서 내용이 이어지므로 이들 문서의 내용을 읽고 오는 것을 추천한다.
먼저, 벡터에 대해 살펴보자. 벡터에는 두 가지 종류가 있는데, 반변 벡터(contravariant vector)라 하여 방향 벡터처럼 우리가 잘 아는 형태의 벡터가 있고 공변 벡터(covariant vector)라 하여 함수의 그래디언트(gradiant) 같은 역할을 하는 벡터가 있다.[23] 이 둘은 축약(contraction)이라는 연산으로 하나의 실수(불변량)를 만들어낼 수 있으며, 따라서 서로에 대해 함수가 된다. 예를 들어, 그래디언트에 방향 벡터를 집어넣으면 함수의 '변화량'이 나온다. 그래디언트와 방향 벡터는 모두 성분이 있고, 좌표계의 선택에 따라 다르지만 둘을 축약한 함수 변화량은 모든 좌표계에서 동의한다.
반변 벡터와 공변 벡터란 개념은 일차적으로 대수적으로 접근하여 성분의 좌표변환이 어떻게 이루어지느냐를 기준으로 정의될 수 있다. 반변 벡터를 위첨자로, 공변 벡터를 아래첨자로[24], 또 새로운 좌표를 프라임 기호로 표현하자. 특수 상대성 이론에서 이들은 로런츠 변환으로 변환될 수 있다. 로런츠 변환은 선형 변환이며, 로런츠 변환 행렬 [math(A^\mu_\nu)]에 대하여 아래와 같이 반변 벡터와 공변 벡터의 변환식을 쓸 수 있다.
[math(\displaystyle X^\mu \to X^{\mu'} = A^\mu_\nu X^\nu, \quad Y_\mu \to Y_{\mu'} = (A^{-1})^\nu_\mu Y_\nu)]
여기에서, 프라임 기호가 벡터가 아니라 첨자에 붙는 것은 좌표변환에서 변하는 건 벡터 자체가 아니라 각 첨자에 대응되는 성분이기 때문이다. 이로부터, 두 벡터의 축약, 혹은 서로에 대한 함숫값을 다음과 같이 쓸 수 있다.
[math(\displaystyle X^{\mu'}Y_{\mu'} = A^{\mu}_{\alpha} (A^{-1})^{\beta}_{\mu} X^{\alpha}Y_{\beta} = \delta^{\beta}_{\alpha}X^{\alpha}Y_{\beta} = X^{\mu} Y_{\mu})]
이처럼, 반변 벡터와 공변 벡터를 이용해 좌표계에 의존하지 않는 연산들을 만들 수 있게 된다. 이러한 성질은 전적으로 성분의 좌표 변환 규칙에 의해 대수적으로 결정된다.
그런데, [math(A^\mu_\nu)]와 [math((A^{-1})^\nu_\mu)]는 아래와 같이 쓸 수 있다.
[math(\displaystyle A^\mu_\nu = \frac{\partial x^{\mu'}}{\partial x^\nu}, \quad (A^{-1})^\nu_\mu = \frac{\partial x^\nu}{\partial x^{\mu'}})]
따라서 벡터들의 변환식은 다음과 같이 쓸 수 있다.
[math(\displaystyle X^\mu \to X^{\mu'} = \frac{\partial x^{\mu'}}{\partial x^\nu} X^\nu, \quad Y_\mu \to Y_{\mu'} = \frac{\partial x^\nu}{\partial x^{\mu'}} Y_\nu )].
이는 로런츠 변환이라는 특정 좌표 변환이 아닌 모든 좌표 변환에 대해 적용될 수 있는 식이다. 따라서, 일반 상대성 이론에서는 반변 벡터와 공변 벡터를 모든 좌표 변환 [math(x^\mu \to x^{\mu'})]에 대해서 위와 같이 변환되는 것이어야 한다고 정할 수 있다.
반변 벡터와 공변 벡터를 적절히 결합하여 임의의 텐서를 정의할 수 있다. [math((m, n))] 텐서는 일반적으로 [math(m)] 개의 공변 벡터와 [math(n)] 개의 반변 벡터와 결합하여 불변량을 만든다. 예를 들어, [math((0, 2))] 텐서 [math(T_{\mu\nu})]는 임의의 두 반변 벡터 [math(A^{\mu}, B^{\mu})]에 대하여
[math(T_{\mu'\nu'}A^{\mu'}B^{\nu'} = T_{\mu\nu}A^{\mu}B^{\nu})]
를 만족시키고, 따라서
[math(\displaystyle T_{\mu'\nu'} = \frac{\partial x^\alpha}{\partial x^{\mu'}}\frac{\partial x^{\beta}}{\partial x^{\nu'}}T_{\alpha\beta})]
와 같이 좌표 변환된다. 물론, 특수 상대성 이론에서도 로런츠 변환을 통해 좌표 변환이 동일하게 주어지며 이것을 확장한 것으로 봐도 좋다. 이런 식으로 임의의 텐서에 대한 좌표 변환 규칙을 정할 수 있다. 텐서는 가장 일반화된 형태의 선형 사상이며, 이로써 일반 상대성 이론에 쓰일 가장 기본적인 형태의 선형 사상들은 모두 살펴보았다.
3.2. 미적분과 메트릭 텐서
여기까지는 특수 상대성 이론의 각 요소를 있는 그대로 확장하면 된다. 그러나 미적분의 경우 대대적인 수정이 불가피하다.미적분은 지금까지 설명한 것들과는 달리 본질적으로 한 점이 아니라 그 점의 근방에 대한 정보에 의존한다. 평평한 공간에 놓인 직교 좌표계에서는 근방에서 좌표계에 특별한 일이 일어나지 않으므로 미적분은 단순한 형태를 띠지만, 일반적인 좌표계를 고려할 경우 근방에서 좌표계가 이리저리 휘게 된다. 특히, 편미분의 방향을 정의하게 될 기저 벡터들의 크기와 방향이 바뀌게 된다. 이 때문에 기존에 하던 대로 미적분을 하게 될 경우 다소 곤란한 일이 발생하게 되는데, 구체적으로 다음을 살펴보자.
특수 상대성 이론에서 [math(x^\mu \to x^{\mu'})]의 좌표 변환이 일어날 때 미분 연산자 [math(\frac{\partial}{\partial x^\mu})]는 다음과 같이 변환된다.
[math(\displaystyle \frac{\partial}{\partial x^\mu} \to \frac{\partial}{\partial x^{\mu'}} = \frac{\partial x^\nu}{\partial x^{\mu'}} \frac{\partial}{\partial x^\nu})]
이로부터 미분 연산자는 마치 공변 벡터처럼 변환된다는 것을 알 수 있다. 따라서 [math(\frac{\partial B}{\partial x^\mu})], [math(\frac{\partial V^\nu}{\partial x^\mu})] ([math(B)], [math(V^\nu)]는 각각 스칼라와 벡터) 같은 것들은 각각 벡터와 텐서로 볼 수 있게 된다.
이제 위에서 설명했던 대로 이 변환을 관성 좌표계 간의 좌표 변환 만이 아닌 일반적인 좌표 변환에서도 성립하는 것으로 보자. 그러면 문제가 생긴다. [math(\frac{\partial B}{\partial x^\mu})]는 잘 변환이 된다는 것을 알 수 있고 따라서 별 문제는 없다. 문제는 스칼라가 아닌 물리량의 도함수의 변환이다. 다음을 보자.
[math(\displaystyle \frac{\partial V^\nu}{\partial x^\mu} \to \frac{\partial V^{\nu'}}{\partial x^{\mu'}} = \frac{\partial x^\alpha}{\partial x^{\mu'}} \frac{\partial V^{\nu'}}{\partial x^\alpha } = \frac{\partial x^\alpha}{\partial x^{\mu'}} \frac{\partial}{\partial x^\alpha} \left( \frac{\partial x^{\nu'}}{\partial x^\beta} V^\beta \right) \ne \frac{\partial x^\alpha}{\partial x^{\mu'}} \frac{\partial x^{\nu'}}{\partial x^\beta} \left( \frac{\partial V^\nu}{\partial x^\mu} \right))].
만약 [math(\frac{\partial x^{\nu'}}{\partial x^\beta})]가 상수라면 위 식의 마지막 두 변은 일치했을 것이다. 하지만 일반적인 좌표 변환에서는 저 행렬이 상수가 아니다. 따라서 두 변은 같지 않고, 따라서 벡터의 도함수는 텐서처럼 변환이 되지 않는다. 즉, 텐서가 아니게 된다. 이것은 더 높은 인덱스를 가진 텐서의 도함수에서도 마찬가지다.
물리 법칙에 도함수가 반드시 필요하다는 것을 생각하면 이것은 반드시 고쳐야 할 문제이다. 이를 위해 아예 도함수 자체를 다른 것으로 교체해야 한다. 공변 도함수(covariant derivative)가 바로 그것인데, 이렇게 바꿔 쓰자는 것이다.
[math(\displaystyle \partial_\mu A^\nu \to D_\mu A^\nu = \partial_\mu A^\nu + \Gamma^\nu_{\mu \lambda} A^\lambda)]
[math(\displaystyle \quad \partial_\mu A_\nu \to D_\mu A_\nu = \partial_\mu A_\nu - \Gamma^\lambda_{\mu \nu} A_\lambda)] [25]
[math(\displaystyle \quad \partial_\mu A_\nu \to D_\mu A_\nu = \partial_\mu A_\nu - \Gamma^\lambda_{\mu \nu} A_\lambda)] [25]
이렇게 정의된 공변 도함수는 다음을 만족시켜야 한다.
[math(\displaystyle D_{\mu'} A^{\nu'} = \frac{\partial x^\alpha}{\partial x^{\mu'}} \frac{\partial x^{\nu'}}{\partial x^\beta} D_{\alpha} A^{\beta})]
[math(\displaystyle D_{\mu'} A_{\nu'} = \frac{\partial x^\alpha}{\partial x^{\mu'}} \frac{\partial x^\beta}{\partial x^{\nu'}} D_{\alpha} A_{\beta})]
[math(\displaystyle D_{\mu'} A_{\nu'} = \frac{\partial x^\alpha}{\partial x^{\mu'}} \frac{\partial x^\beta}{\partial x^{\nu'}} D_{\alpha} A_{\beta})]
여기서 [math(\Gamma^\nu_{\mu \lambda})]는 Christoffel 기호인데, 일단 텐서는 아니라는 것을 직접 변환시켜 보는 것으로 확인해 볼 수 있다. 하지만 저렇게 텐서가 아닌 보통 도함수와 결합하여 텐서를 만들 수 있다. (인덱스 수가 더 높은 텐서의 도함수 같은 경우, 공변 도함수는 좀 더 복잡해진다. 그래 봤자 인덱스 하나 당 Christoffel 기호가 하나씩 더 붙는 것에 지나지 않지만.) 이런 식으로 특수 상대성 이론에서 쓰이던 도함수들을 전부 공변 도함수로 바꿔야 할 필요가 있다.
그런데, 이 상태에서 Christoffel 기호는 좌표 변환 규칙만을 알지 구체적으로 어떤 값을 갖게 되는지는 알 수 없다.[26] 여기서 새로운 [math((0, 2))] 텐서 [math(g_{\mu\nu})]를 도입하자. 이 텐서는 임의의 공간에서 자체적으로 장착할 수 있으며, 일반적으로 미적분의 기준이 되는 텐서이다. 이 [math(g_{\mu\nu})]는 언제나 [math(\nabla_{\sigma}g_{\mu\nu} = 0)]을 만족시킨다고 정하자. 그러면 [math(\nabla_{\mu}g_{\nu\sigma} = \nabla_{\nu}g_{\sigma\mu} = 0)]과 연립하여 다음을 얻게 된다.
[math(\displaystyle \Gamma^\lambda_{\mu \nu} = \frac{1}{2} g^{\lambda \alpha} \left( \partial_\mu g_{\nu \alpha} + \partial_\nu g_{\mu \alpha} - \partial_\alpha g_{\mu \nu} \right))]
여기서 [math(g^{\mu \nu})]는 [math(g_{\mu \nu})]의 역행렬 쯤에 해당하는 것으로, 정확하게는 [math(g_{\mu \nu} g^{\nu \lambda} = \delta_\mu^\lambda)]로 정해지는 텐서다. 뒤에 다시 나오겠지만 이것을 메트릭 텐서라고 부른다. [math(g_{\mu\nu})]와 이 식을 잘 기억해두자.
미분이 바뀌었으니 적분도 바뀌어야 할 것이다. 여러 가지 적분이 있지만 여기서는 4차원 적분만 다뤄 보겠다. 특수 상대성 이론에서 4차원 적분은 그 자체로 불변하는데, 다음 식으로부터 분명하다.
[math(\displaystyle d^4 x \to d^4 x' = \left| \det{\frac{\partial x^{\mu'}}{\partial x^\nu}} \right| d^4 x = \left| \det{A^\mu_\nu} \right| d^4 x.)]
이때 로렌츠 변환 행렬의 행렬식(determinant)는 항상 1 혹은 -1이다. 따라서 [math(d^4 x' = d^4 x)]임을 알 수 있다. 이것은 특수 상대성 이론, 즉 좌표 변환이 관성 좌표계 간의 변환일 때의 이야기였다. 하지만 일반적인 좌표 변환의 경우, [math(\left| \det{\frac{\partial x^{\mu'}}{\partial x^\nu}} \right|)]는 항상 1이 아니다. 따라서 [math(d^4 x')]와 [math(d^4 x)]는 일반적으로 같지 않다.
그런데 만약 어떤 텐서 [math(g_{\mu \nu})]를 이용하면 다음을 알 수 있다.
[math(\displaystyle \begin{aligned}\sqrt{-\det{} g_{\mu \nu}} d^4 x & \to \sqrt{-\det{} g_{\mu' \nu'}} d^4 x' \\ &= \sqrt{-\left( \det{\frac{\partial x^\alpha}{\partial x^{\mu'}}} \right) \left( \det{g_{\alpha \beta}} \right) \left( \det{\frac{\partial x^\beta}{\partial x^{\nu'}}} \right)} \left| \det{\frac{\partial x^{\mu'}}{\partial x^\nu}} \right| d^4 x \\ &= \sqrt{-\det{} g_{\mu \nu}} d^4 x \end{aligned})]
(여기서 행렬 [math(\frac{\partial x^{\mu'}}{\partial x^\nu})]의 역행렬이 [math(\frac{\partial x^\nu}{\partial x^{\mu'}})]이므로 이들의 행렬식이 서로 역수 관계임을 이용하였다.)
따라서 [math(\sqrt{-\det{g_{\mu' \nu'}}} d^4 x' = \sqrt{-\det{g_{\mu \nu}}} d^4 x)]가 성립한다. 즉, [math(\sqrt{-\det{g_{\mu \nu}}} d^4 x)]는 일반적인 좌표 변환에 대해서 불변이다. 이는 도함수에서 그랬던 것과 마찬가지로 특수 상대성 이론에서 쓰였던 모든 [math(d^4 x)]를 [math(\sqrt{-\det{g_{\mu \nu}}} d^4 x)]로 교체해야 한다는 것을 말해 준다. 여기에서 한 가지 고려해야 할 점은 관성 좌표계의 경우 4차원 부피가 단순히 [math(d^4 x)]가 되어야 한다는 것이다. 따라서, 평평한 시공간의 직교 좌표계에서는 항상 [math(|\det g_{\mu\nu}| = 1)]로 주어져야 한다. 또한 [math(\det g_{\mu\nu} < 0)]도 성립해야 하는데, 이에 대해서는 다음 단락에서 설명한다.
이렇게 미적분을 수정하는 과정에서 미분, 적분 양쪽에서 [math(g_{\mu\nu})]라는 특정 [math((0, 2))] 텐서의 도입이 필요하였으며, 이 텐서는 [math(\nabla_{\sigma}g_{\mu\nu} = 0)]과 [math(\det g_{\mu\nu} < 0)], (직교 좌표계에서) [math(|\det g_{\mu\nu}| = 1)]을 만족시켜야 했다.
마지막으로, 내적에 대해 알아보자. 특수 상대성 이론에서 내적은 [math(\eta_{\mu \nu} = \mathrm{diag}(-1, 1, 1, 1))]에 대하여
[math(A\cdot B = -A^0B^0 + A^1B^1 + A^2B^2 + A^3B^3 = \eta_{\mu\nu}A^{\mu}B^{\nu})]
라 주어진다. 내적은 불변량이므로 [math(\eta_{\mu \nu})]는 일종의 [math((0, 2))] 텐서이다. 이제 일반적인 좌표 변환을 고려한다면 [math(\eta_{\mu \nu})]는 텐서로서 당연히 변형된다. 예를 들면 관성 좌표계 [math((x_0, x_1, x_2, x_3) = (ct, x, y, z))]에서 구면 좌표계 [math(((x')_0, (x')_1, (x')_2, (x')_3) = (ct, r, \theta, \phi))]로 좌표 변환을 한다고 했을 때 [math(\displaystyle g_{\mu\nu} = \frac{\partial x^{\alpha}}{\partial x^\nu} \frac{\partial x^{\beta}}{\partial x^{\nu}}\eta_{\alpha\beta})]에 따라 계산하면 [math(g_{\mu \nu} = \mathrm{diag}(-1, 1, r^2, r^2\sin^2{\theta}))]가 된다. 좀 더 임의적인 좌표변환을 생각하면 대각 성분도 0이 아니도록 만들 수 있다. 이렇게 내적을 계산해주는 텐서를 메트릭 텐서(metric tensor)라고 부른다. 또한, 메트릭 텐서는 반변 벡터와 공변 벡터를 서로 대응시켜줌으로써 내적을 통해 축약을 계산해주기도 한다. 예를 들어,
[math(\displaystyle A^{\mu}B_{\mu} = g_{\mu\nu}A^{\mu}B^{\nu})]
라 두면 [math(B_{\mu} = g_{\mu\nu}B^{\nu})]이다.
[math(g_{\mu\nu})]의 가장 주목할 점은 시공간의 기하학적 성질을 결정할 수 있다는 사실이다. 변위 벡터 [math(dx^{\mu})]에 대하여 [math(A^{\mu} = B^{\mu} = dx^{\mu})]를 대입하면, [math(g_{\mu\nu})]는 이웃한 두 점 사이의 거리를 결정한다. 시공간의 기하학적 성질은 이처럼 이웃한 두 점 사이를 모두 알면 결정할 수 있다고, 매우 단순하게 생각할 수 있다. 혹은, 각 점에서 좌표계에 대한 기저 벡터 [math(\vec{e}_{\mu}, \vec{e}_{\nu})]를 대입하면
[math(\vec{e}_{\mu} \cdot \vec{e}_{\nu} = g_{\alpha\beta} \delta^{\alpha}_{\,\,\mu} \delta^{\beta}_{\,\,\nu} = g_{\mu\nu})]
가 되므로, [math(g_{\mu\nu})]는 각각의 점에서 좌표계의 기저 벡터들이 어떻게 놓여 있는지, 즉 좌표계 격자가 어떻게 놓여 있는지를 가장 직접적으로 나타낸다. 일반적으로, 적절한 좌표를 선택하여 공간 전체에 직교 좌표계 즉, 좌표계 격자의 크기가 일정하고 축들이 전부 수직을 유지할 수 있도록, 다시 말해 모든 점에서 [math(g_{\mu\nu} = \eta_{\mu\nu})]라 둘 수 있다면 공간은 평평하다는 것을 알 수 있으며, 그것이 불가능하다면 공간은 휘어있음을 알 수 있다. 따라서, 시공간의 곡률을 계산하기 위해서는 메트릭 텐서 [math(\boldsymbol{g_{\mu\nu}})]와 그 도함수로만 이루어진 텐서가 필요함을 알 수 있다.
미적분에서 도입된 [math(g_{\mu\nu})]와 내적으로 정의된 [math(g_{\mu\nu})], 이 세 가지는 사실 모두 같은 텐서임을 기대한다. 원한다면 제각각 임의로 정의될 수도 있으나, 기하학적으로 가장 직관적이고 의미있는 방식은 이 셋을 모두 통일하는 것이다. 이제 마지막 관건은 [math(g_{\mu\nu})]를 구체적으로 어떻게 정의하느냐는 것이다.
결국, 일반 상대성 이론이 의도하는 바는 특수 상대성 이론을 일반화하는 것이며, 이를 반대로 말하면 일반 상대성 이론은 특수한 경우, 즉 평평한 경우 특수 상대성 이론으로 수렴해야 한다는 말이 된다. 따라서, [math(g_{\mu\nu})] 역시 특수한 경우 특수 상대성 이론에 수렴하도록 주어져야 한다. 이것을 보장해주는 것이 등가 원리이다.
등가 원리는 시공간상의 각 점에 대한 조그만 근방에서 언제나 적당한 좌표의 선택으로 특수 상대성 이론이 성립하도록 만들 수 있다고 말한다. 이미 [math(\eta_{\mu \nu})]가 전혀 다른 무언가로 교체된 데다 어떠한 좌표에서도 측지 텐서가 [math(\eta_{\mu \nu})]와 같지 않을 수도 있다는데, 그런 걸 어떻게 기대할 수 있겠는가 싶겠지만 수학적으로 가능하다. 이는 임의의 한 점에서 메트릭 텐서 [math(g_{\mu \nu})]가 매우 천천히 변하도록, 다시 말해 각각의 첨자에 대하여 [math(g_{\mu\nu} = \eta_{\mu\nu})]와 [math(\partial_{\sigma}g_{\mu\nu} = 0)]이 되도록 정하는 것과 같으며, 이것이 항상 가능하다는 것은 수학적으로 증명할 수 있다. (단, [math(\partial_{\sigma}\partial_{\tau}g_{\mu\nu} = 0)]이 되도록 만드는 것은 일반적으로 불가능한데, 이는 공간의 곡률과 관련있다.)
여기서 중요한 것은 -1의 개수인데, 만약 하나도 없다면 이 좌표계에서 벡터 간의 축약은 그야말로 [math(\sum A_i B_i)]로 근사될 수 있어 n차원 유클리드 기하학이 되는 것이다.[27] 여기서 이러한 좌표계가 사실 상 위에서 설명한 [math(\delta_{ij})]라든가 [math(\eta_{\mu \nu})]와 같은 것으로 측지 텐서를 변형시킨다는 것을 알 수 있다. 그런데 등가원리를 생각해 보면 바로 이러한 좌표계에서 해당 점의 적당한 근방을 관성 좌표계처럼 잡을 수 있다는 것을 짐작할 수 있다. 등가원리는 다름 아닌 그런 좌표 변환이 모든 점에서 항상 가능하며, 그 점의 근방에서 측지 텐서가 [math(\eta_{\mu \nu})]와 같음을, 즉 특수 상대성 이론을 만족한다는 사실을 말해 준다. 즉, 등가원리는 관성 좌표계가 (근사적으로나마) 좌표 변환을 통해 나타날 수 있도록 시공간에 가해지는 제한인 셈이다. 이렇게 해서 등가 원리를 통해 휘어진 시공간과 일반적인 좌표 변환을 고려하더라도 관성 좌표계라고 부를 수 있는 좌표계를 정한 것이다.
마지막으로, 지금까지 임의로 준듯한 조건들이 어떻게 정당화되는지 살펴보자.
(1) [math(\nabla_{\sigma}g_{\mu\nu} = 0)]
특수 상대성 이론에서 [math(\partial_{\sigma}\eta_{\mu\nu} = 0)]이므로, 각각을 그대로 확장하면 얻을 수 있다. (사실, 이는 등가 원리에 의한 것이라기보다는 내적의 보존, 측지선의 경로 최적화 등 다른 이유로 인해 기하학적으로 가장 자연스러운 성질이다. - 레비치비타 접속)
(2) [math(\det g_{\mu\nu} < 0)]
[math(\det \eta_{\mu\nu} = -1)]이고, 그것을 일반화한 [math(g_{\mu\nu})]의 determinant는 변환 행렬의 제곱을 곱하면 되므로 바로 얻게 된다.
3.3. 메트릭 텐서와 액션
지금까지 좌표 변환과 내적의 일반화와 확장을 이야기해 봤다. 상대성 이론을 확장시킨다는 것은 이런 것들을 필요로 한다는 것이다. 사실 이러한 것들, 즉 좌표 변환에 대해 [math(A^\mu \to \frac{\partial x^{\mu'}}{\partial x^\nu} A^\nu)]와 같이 변환하면서 측지 텐서 [math(g_{\mu \nu})]에 의한 내적(축약)을 갖는 대상들, 그리고 그 미적분학은 이미 수학에서 연구가 되어 있는 상태였다. 그것이 바로 미분 기하학, 특히 리만 기하학이다. 아인슈타인의 친구 그로스만이 찾아냈다던 그 리만 기하학 말이다.[28] 다만 휘어진 (시)공간과 그 일반적인 좌표 변환을 우주에다 적용시킬 용자는 아인슈타인 이전에 단 한 명도 없었다.사실, 리만 기하학은 일반 상대성 이론에 사용될 수 있을 정도의 충분한 수준으로 정립된 지 (1901년 리치, 레비치비타가 발표하였다.) 10여 년밖에 안 된 최신 학문이었다. 일반 상대성 이론은 뛰어난 직관을 가진 아인슈타인과 그의 4차원 시공간 이론 (특수 상대성 이론) 및 등가 원리, 훌륭한 수학자 동료 그로스만, 그리고 오랜 기간 지식이 누적되어 성립된 리만 기하학이 절묘하게 한날 한시에 모이면서 이룩된 그야말로 기적에 기적이 이어진 이론인 셈이다. 이 중 하나라도 없었다면 일반 상대성 이론이 그렇게 빨리 성립될 수 있었을지는 모를 일이다.
아무튼 이렇게 해서 특수 상대성 이론에 맞던 물리 법칙을, 즉 관성 좌표계 간 좌표 변환에 대해 불변하던 물리 법칙을 일반적인 좌표 변환에 대해서도 그 모습이 불변하도록 수정할 수 있는 준비가 다 된 셈이다. 어차피 특수 상대성 이론과 잘 부합하는 물리 법칙들은 원하는 스칼라, 벡터, 텐서들 그리고 그것들의 도함수([math(\partial_\mu)] 같은 것들이 붙은 것)들을 잘 축약(내적)하여 스칼라로 만든 다음 적분한 것을 액션으로 취하여 얻어진 것이다. 예를 들어 전자기장은, 일단 소스(source)가 없을 때, 즉 [math(j^\mu = 0)]일 때 그 액션이 다음과 같다는 것을 위에서 봤다.
[math(\displaystyle S = \int \left( -\frac{1}{4\mu_0} \eta^{\mu \alpha} \eta^{\nu \beta} F_{\mu \nu} F_{\alpha \beta} \right) d^4 x = \int \left( -\frac{1}{4\mu_0} \eta^{\mu \alpha} \eta^{\nu \beta} (\partial_\mu A_\nu - \partial_\nu A_\mu) (\partial_\alpha A_\beta - \partial_\beta A_\alpha) \right) d^4 x)]
이것은 관성 좌표계 간의 좌표 변환에서 불변인 값이다. 하지만 위에서 봤듯이 이 식은 일반적인 좌표 변환에 대해서 불변하지 않을 것이다. 다만 간단한 교체를 통해 위 식이 일반적인 좌표 변환에 대하여 불변이도록 수정이 가능하다는 것 또한 위에서 봤었다. 단지 도함수([math(\partial_\mu)])를 공변 도함수([math(D_\mu)])로, 축약에 쓰이는 텐서 [math(\eta_{\mu \nu})]를 보다 일반적인 측지 텐서 [math(g_{\mu \nu})]로, 4차원 적분 [math(d^4 x)]를 [math(\sqrt{-g} d^4 x)]로 바꾸면 된다. 여기서 [math(g)]는 [math(\det{g_{\mu \nu}})]를 짧게 줄여 쓴 것이다. 이런 식의 수정을 가하면 위 액션은 다음과 같이 쓸 수 있다.[math(\displaystyle \begin{aligned} S &= \int \left( -\frac{1}{4\mu_0} g^{\mu \alpha} g^{\nu \beta} F_{\mu \nu} F_{\alpha \beta} \right) \sqrt{-g} d^4 x \\ &= \int \left( -\frac{1}{4\mu_0} g^{\mu \alpha} g^{\nu \beta} (D_\mu A_\nu - D_\nu A_\mu) (D_\alpha A_\beta - D_\beta A_\alpha) \right) \sqrt{-g} d^4 x \end{aligned})] [29]
이렇게 해서 전자기학을 일반 상대성 이론에 맞도록 수정을 가했다. 입자가 받는 힘 또한 고려해야 하는 것일테지만 조금 어렵고 모호한 점이 있어서 생략하기로 한다. 이런 식으로 물질(전자기장을 포함)을 기술하는 일반적인 액션을 만들 수 있다. 이렇게 일반적인 좌표 변환을 해도 물리가 변하지 않는다고 (즉 상대성 원리가 적용된다고) 주장을 하기에 우리는 이 주장을 가리켜 일반 상대성 이론이라고 부르는 것이다.
이제 액션의 보다 일반적인 구조를 고찰해 보자. 그러고 보면 맥스웰 방정식을 유도할 때도 그랬고 액션에 들어갈 수 있는 것은 어떤 물리량을 가지고 만들어진 스칼라뿐이라는 것을 봤었다. 전자기장의 경우 [math(A^\mu)]가 있다고 가정한 다음 이걸로 만들 수 있는 스칼라들을 고려했고 그렇게 해서 나온 전자기장의 라그랑지안이 바로 [math(-\frac{1}{4\mu_0} F_{\mu \nu} F^{\mu \nu})]였다. 그런데 이 식을 보면 축약이 들어가 있다. 사실 이미 벡터 [math(A^\mu)]로 스칼라를 만들겠다는 것에서부터 축약이 필요하긴 했었다. 만약 스칼라인 물리량 [math(\phi)]로 액션을 만든다면? 이때에는 단순히 [math(\phi^2)], [math(\phi^4)] 같은 축약이 없는 항들만으로도 충분해 보일 것이다. 하지만 물리적으로 의미 있는 양은 항상 시간과 공간에 대해 변하는 양이다.[30] 그리고 물리적으로 그 양을 기술한다는 것은 그 양이 시간과 공간에 대해 어떻게 변하는지도 같이 다뤄야 한다는 것이다. 이미 전자기학의 라그랑지안에는 [math(A^\mu)]의 도함수가 들어 가 있지 않은가. 따라서 스칼라만 다룬다 하더라도 올바른 라그랑지안 안에는 그 스칼라의 도함수 [math(\partial_\mu \phi)]가 반드시 포함되어 있어야 하며, 그러기 위해서는 역시 축약이 또 필요하다는 것을 알 수 있다. 결국 말하고 싶은 게 뭐냐면, 물질을 다루는 액션 혹은 라그랑지안은 반드시 축약을 포함한다는 것이다. 이것을 다르게 표현하자면 물질을 다루는 라그랑지안에는 측지 텐서가 반드시 포함되어 있다는 것이다. 축약을 하면 반드시 측지 텐서를 곱해서 싹 더해야 했었고, 그걸 가리킨 것이다. 이미 물질은 측지 텐서와 엮여(coupling)있는 것인 셈이다. 그런데 앞서 말했듯이 측지 텐서에는 시공간의 구조, 즉 시공간이 어떻게 휘어져 있는가 하는 정보가 담겨 있다. 이 사실은 다음과 같은 중요한 사실을 암시한다. 애초부터 물질은 시공간의 휘어짐에 대한 정보(측지 텐서)와 얽혀 있다. 그런데 전자기학의 경우에서 입자-장이 엮여 있는 액션 항이 있다면 반드시 장만의 액션 항이 필요하다는 것을 봤었다. 지금 우리는 물질-측지 텐서가 엮여 있는 액션 항을 가지고 있다. 그렇다면 올바른 액션은 측지 텐서만을 위한 액션 항을 포함해야 할 것이다. 한편 전자기학에서는 두 액션 항(입자-장 항, 장의 항)이 있다는 것이 입자의 분포가 곧 장의 모습을 결정지어 주는 것([math(\partial_\mu F^{\mu \nu} = \mu_0 j^\nu)])을 봤었다. 즉, 입자가 분포해 있으니 전자기장이 생겼다. 지금 우리는 물질-측지 텐서 항과 측지 텐서 항이 있어야 함을 안다. 결국 다음을 얻는다.
물질의 분포가 시공간의 휘어짐을 결정한다.
정리해 보자. 아까 우리는 일단 중력을 깡그리 잊어버리고 (아직 우리가 아는 그 중력이 나타났다고 말할 수는 없다) 물리 법칙이 일반적인 좌표 변환에 대해 불변하고 시공간이 평평하지 않을 수도 있다는 것[31], 그리고 등가원리(어떤 좌표계는 특수 상대성 이론에서 말하는 그 관성 좌표계로 볼 수 있다)[32]를 가정했었다. 그런데 이러한 몇 안 되는 가정들로부터 우리는 물질로 인해 시공간이 필연적으로 휘어야 한다는 것을 도출해냈다. 저 위에서 말한 아인슈타인의 빛나는 업적이 바로 이것이다. 단순한 법칙들로 중대한 결과가 튀어 나온 것이다. 하지만 아직 측지 텐서가 어떻게 변할 것인가를 다루진 않았다. 어쩌면 시공간은 휘어져 있지 않을지도 모른다. 수학적으로 측지 텐서의 액션을 봐야 알 수 있을 것이다.
4. 아인슈타인-힐베르트 액션, 아인슈타인의 장방정식
먼저 위에서 설명한 액션을 이렇게 써 보자.[math(S = S_M + S_G)].
[math(S_M)]는 물질의 액션으로 사실 일반 상대성 이론을 몰랐으면 총 액션은 이거 하나만 있었을 것이다. 물론 우리는 이것에 대해 안다.
측지 텐서와 그 도함수로 그럴 듯한 스칼라를 만드는 것은 사실 간단한 일이 아니다. 측지 텐서의 공변 도함수는 항상 0이라는 것을 보일 수 있으니, 측지 텐서의 (보통) 도함수가 들어간 전혀 다른 종류의 스칼라를 찾아야 한다. 사실 Christoffel 기호가 측지 텐서의 도함수로 구성되어 있다는 것을 보일 수 있는데, 문제는 이 기호가 텐서는 아니라는 점에 있다.[33] 다른 방법이 필요하다.
미친(…) 수학자들은 그 답을 이렇게 생각해 냈다. 벡터 [math(A^\mu)]가 주어져 있을 때 그 공변 도함수 [math(D_\mu A^\nu)]는 [math(A^\mu)]와 그 도함수가 들어가 있다. 이는 [math(D_\mu D_\nu A^\lambda)]에서도 마찬가지다. 하지만 [math(D_\mu D_\nu A^\lambda - D_\nu D_\mu A^\lambda = (D_\mu D_\nu - D_\nu D_\mu) A^\lambda ( = [D_\mu, D_\nu] A^\lambda))]는 오로지 [math(A^\mu)]만 들어가 있고 그 도함수는 안 들어가 있다는 것을 알 수 있다. 더군다나 그 모양에서도 보이듯이 이 식은 [math(A^\mu)]에 대해 선형이다. 따라서 위 식은 다음과 같이 표기할 수 있다.
[math(\displaystyle (D_\mu D_\nu - D_\nu D_\mu) A^\lambda = R^\lambda_{\mu \nu \rho} A^\rho)]
공변 도함수가 미분 연산자와 Christoffel 기호로만 이루어져 있으므로 이 새로운 값 [math(R^\lambda_{\mu \nu \rho})]는 Christoffel 기호와 그 도함수, 혹은 측지 텐서와 그 도함수로 구성되어 있는 것이다. 또한 [math(D_\mu D_\nu A^\lambda)]와 [math(D_\nu D_\mu A^\lambda)] 둘 다 텐서라는 사실로부터 [math(R^\lambda_{\mu \nu \rho})] 역시 텐서라는 것을 알 수 있다. 이 텐서를 가리켜 리만 곡률 텐서라고 부른다.[34] 이 텐서는 시공간의 곡률에 대한 정보를 담고 있는 양이다.좀 더 가 보자. 이제 이 텐서로 축약을 만들어 볼 것이다. 축약을 만드는 방법은, 마침 위 첨자가 하나 있으므로 이 첨자와 [math(\mu, \nu, \lambda)] 중 하나와 엮어서 더하는 것이 있다. 그런데 계산을 해 보면 [math(R^\lambda_{\mu \nu \lambda})]는 항상 0임을 알 수 있다. 한편, 정의로부터 [math(R^\lambda_{\mu \nu \rho} = -R^\lambda_{\nu \mu \rho})]이므로 [math(\mu)]나 [math(\nu)]나 어느 것을 엮어도 결과는 부호 빼고 똑같을 것이라는 것을 알 수 있다. 따라서 사실상 가능한 축약은 하나뿐이다. 이제 그 축약을 이렇게 정의하자.
[math(\displaystyle R_{\mu \nu} = R^\lambda_{\mu \lambda \nu})]
이 텐서를 가리켜 리치 텐서라고 부른다. 이 텐서는 한편 [math(R_{\mu \nu} = R_{\nu \mu})]를 만족한다. 하나 더 해 보자. 이번엔 이 Ricci 텐서를 축약해 보자. 이렇게.
[math(\displaystyle R = g^{\mu \nu} R_{\mu \nu})]
이 텐서를 가리켜 리치 스칼라라고 부른다.
앞에서 리만 텐서는 측지 텐서와 그 도함수들로만 구성되어 있다고 했었다. 그리고 그걸 축약해서 스칼라 하나를 만들어냈다. 우리는 경험적으로 측지 텐서를 위한 라그랑지안이 측지 텐서의 일차 도함수의 제곱 혹은 이차 도함수까지만 포함되어 있기를 기대하고 있다.[35] 아니면 라그랑지안의 단순성도 괜찮다. 아무튼 이러한 요구사항 때문에 더 많은 스칼라는 필요하지 않고 다만 이 Ricci 스칼라만으로 우리가 원하는 라그랑지안을 구성하기에는 충분할 것이다.[36]
이제 준비물은 다 마련이 되었다. 전자기장을 다룰 때 했던 것처럼 라그랑지안에 들어갈 스칼라를 알았으면 액션을 다음과 같이 잡아야 한다는 것을 금방 할 수 있다. 물론 일반적인 좌표 변환을 고려해야 하기에 적분에는 [math(\sqrt{-g})]가 포함되어 있어야 한다는 것을 잊지 말자.
[math(\displaystyle S_G = \int \left( \frac{c^4}{16 \pi G} R \right) \sqrt{-g} d^4 x)]
여기서 부호는 위에서 그랬던 것처럼 액션이 최소가 되게 하기 위해 저렇게 잡은 것이고, [math(G)]는 상수로, 나중에 고전적인 영역으로 근사를 취할 때 왜 그냥 [math(G)]가 아니고 [math(\frac{c^4}{16 \pi G})]로 잡았는지를 알게 될 것이다. 아무튼 이렇게 해서 우리는 측지 텐서, 즉 시공간의 휘어짐을 다루는 액션을 얻었다. 이것을 아인슈타인-힐베르트 액션이라 한다.
그런데 스칼라로는 다른 것도 있지만 그냥 상수도 있다. 그래서 위 액션은 이렇게 수정되기도 한다.
[math(\displaystyle S_G = \int \left( \frac{c^4}{16 \pi G} (R -2 \Lambda) \right) \sqrt{-g} d^4 x)]
여기서 [math(\Lambda)]는 어떤 상수로서, 이 상수가 그 유명한 우주 상수(cosmological constant)이다. 아인슈타인 최대의 실수로 불렸지만 나중에 가속 팽창을 설명하기 위해 화려하게 부활한 값이다. 그런데 이 값은 물질 항에다 옮겨 넣을 수 있으며 이때 이 항은 물질의 진공 에너지를 의미하게 된다. 우리가 흔히 알고 있는 암흑 에너지(Dark energy)의 정체가 바로 이것이다. 따라서 우주의 진공이 어떤 실체를 가지느냐를 밝히는 것이 우주 상수 혹은 암흑 에너지의 정체를 밝혀줄 것이다.
이제 마무리를 해 보자. 액션을 구했으니 장방정식을 구해야 한다. 측지 텐서에 대한 변분을 취하면 장방정식을 얻을 수 있다. 그런데 물질(-측지 텐서 coupling) 액션 항에 측지 텐서에 대한 변분을 취하면 그 결과로 물질의 에너지-운동량 분포, 혹은 더 정확하게 에너지-운동량 스트레스 텐서 [math(T_{\mu \nu})]가 나온다는 것이 알려져 있다. 한편, 아인슈타인-힐베르트 액션에 변분을 취하면 다음이 얻어진다.
[math(\displaystyle -\frac{c^4}{8 \pi G} \left( R_{\mu \nu} - \frac{1}{2} g_{\mu \nu} R \right))]
변분법은 두 액션의 변분, 즉 [math(T_{\mu \nu})]와 [math(-\frac{c^4}{8 \pi G} \left( R_{\mu \nu} - \frac{1}{2} g_{\mu \nu} R \right))]의 합이 0임을 말해준다. 이를 정리하면 결국 다음을 얻는다. [math(\displaystyle R_{\mu \nu} - \frac{1}{2} g_{\mu \nu} R = \frac{8 \pi G}{c^4} T_{\mu \nu})]
이것이 바로 그 유명한 아인슈타인 장방정식(Einsteinsche Feldgleichungen)이다. 이 방정식은 최종적으로 물질의 (에너지) 분포가 시공간의 휘어짐을 결정한다라는 앞서 내렸던 결론을 수학적으로 확실하게 보여주는 것이다. 이 방정식 하나로 물질의 분포로부터 시공간의 모양을 알아낼 수 있다. 짧아 보이는 이 방정식을 푸는 것은 사실 무척 어렵다. 실제로 구해야 하는 것은 측지 텐서인데, 저 방정식을 측지 텐서와 그 도함수로만 표현하면 엄청나게 복잡해지며, 무엇보다도 저 방정식은 비선형 편미분방정식이다.
마지막으로 시공이 휘어졌다는 것이 고전역학에서 무엇과 매칭이 되는가를 알아 보겠다. 비선형 편미분 방정식이라고 했지만 고전적인 영역(측지 텐서의 변화가 매우 작고 물질의 속도가 광속보다 작으며 물질의 분포가 별로 빽빽하지 않은 영역)에서 아인슈타인 장방정식은 충분히 간단하게 표현된다. 먼저 방정식을 조금 바꿔 써 보자. 방정식에 축약을 가하면 [math(\frac{1}{2} R = \frac{8 \pi G}{c^4} g^{\mu \nu} T_{\mu \nu} = \frac{8 \pi G}{c^4} T^\mu_\mu)]를 얻게 되는데, 이걸 대입해서 정리한 다음, 인덱스 하나를 위로 올려 주면 ([math(g^{\mu \nu})] 하나를 곱해 축약해 주면 된다) 다음을 얻는다.
[math(\displaystyle R^\mu_\nu = \frac{8 \pi G}{c^4} \left( T^\mu_\nu - \frac{1}{2} \delta^\mu_\nu T^\lambda_\lambda \right))]
물질 분포가 점입자 하나라면 [math(T^0_0 - \frac{1}{2} \delta^0_0 T^\lambda_\lambda = \frac{1}{2} \rho c^2)]으로 표현됨을 계산할 수 있는데, 여기서 [math(\rho)]는 질량 M의 점입자에 대한 디랙 델타 함수 모양의 질량 밀도 함수이다. 이로부터 다음을 얻는다.
[math(\displaystyle R^0_0 = \frac{4 \pi G \rho}{c^2})]
여기서 [math(R^0_0)]는 다음과 같이 근사될 수 있다.
[math(\displaystyle R^0_0 \approx \frac{1}{2} \nabla^2 g_{00})]
따라서 [math(\nabla^2 g_{00} = \frac{8 \pi G \rho}{c^2})]를 얻게 된다. 여기서 [math(g_{00} = 1 + \frac{2\phi}{c^2})]라고 표기하면 방정식은 다음과 같이 써진다.
[math(\displaystyle \nabla^2 \phi = 4 \pi G \rho)]
이것은 중력 퍼텐셜에 대한 미분 방정식으로, 이것을 풀면 [math(\phi = -\frac{GM}{r})]를 얻는다. 정확하게 뉴턴의 중력 법칙에서 얻어지는 퍼텐셜이다! 하지만 이것만으로는 부족하다. 아직 이것은 단지 측지 텐서 중 한 성분을 조금 다르게 표현한 것에 지나지 않는다.
이 식의 의미를 알려면 휘어진 공간에서 입자의 경로가 어떻게 결정되는지 봐야 한다. 이 입자는 위에서 다룬 질량 M인 입자보다 훨씬 가벼운 입자인데(따라서 이 입자에 의한 시공간의 휘어짐은 생각하지 않겠다), 이 입자의 경로는 다음과 같이 주어지게 된다.
[math(\displaystyle \frac{d^2 x^\mu}{d \tau^2} + \Gamma^\mu_{\alpha \beta} \frac{dx^\alpha}{d\tau} \frac{dx^\beta}{d\tau} = 0)]
사실 이 식은 측지선(geodesic) 방정식으로, 빛같이 질량이 없는 입자에 한한 것이긴 하지만 여기서 써도 크게 상관은 없을 것이다. 아무튼 고전적인 경우 입자의 속력은 느릴 것이고 이때 [math(\mu = i = 1, 2, 3)]에 대하여 위 식은 다음과 같이 근사할 수 있게 된다.
[math(\displaystyle \frac{d^2 x^\mu}{d \tau^2} + \Gamma^\mu_{\alpha \beta} \frac{dx^\alpha}{d\tau} \frac{dx^\beta}{d\tau} \approx \frac{d^2 x^i}{dt^2} + \Gamma^i_{00} c^2 \approx \frac{d^2 x^i}{dt^2} + \frac{c^2}{2} \left( \partial_i g_{00} \right) = \frac{d^2 x^i}{dt^2} + \left( \vec{\nabla} \left( \frac{c^2}{2} g_{00} \right) \right)_i = 0)]
위에서 쓴 [math(g_{00})]의 다른 표기를 쓰면 다음을 얻는다.
[math(\displaystyle \frac{d^2 \vec{x}}{dt^2} \approx -\vec{\nabla} \left( \frac{c^2}{2} g_{00} \right) = -\vec{\nabla} \phi = -\frac{GM}{r^3} \vec{r})]
이것은 정확하게 뉴턴의 만유인력 법칙이다. 이로부터 중력의 정체는 다름 아닌 시공간의 휘어짐이라는 결론을 얻을 수 있게 되었다! 이렇게 해서 우리는 맨 처음에 잊어버렸던 중력을 다시 이끌어내었다. 다시 강조하지만 물질에 의해 시공간이 휘어진다는 것과 중력이 사실은 시공간의 휘어짐이라는 이 모든 결과는 단지 물리 법칙이 일반적인 좌표 변환에 대해 불변이어야 한다는 것을 요구한 것만으로부터 얻어진 것이다. 즉, 일반 상대성 이론은 필연적으로 중력을 내포할 수밖에 없다는 것이다.
이러한 놀라운 결과를 얻어내긴 했지만 위에서도 주석으로 언급했듯이 이 모든 것은 실험과 잘 맞아야 한다. 사실 시공간이 애초부터 휘어져 있지 않았을 수도 있는 것이니까.[37] 하지만 에딩턴 등의 실험에 의하여 빛이 정말로 휘어져서 온다든가 그 유명한 수성의 근일점 문제를 해결했다는 점이라든가 하는 검증을 통해 일반 상대성 이론과 그로부터 얻어진 중력 이론은 옳은 것으로 인정 받았고, 지금도 거시적인 규모에서 실험과 위배된 적이 없는 이론으로 굳건히 서 있다. 하지만 실험이 어떻게 됐든 이러한 사유는 전에 없던 획기적인 것이었고 이론가들의 가장 주요한 무기 중 하나로 우뚝 서게 된다. 오죽 했으면 (저 위에 있는 주석 내용이지만) 아인슈타인은 실험이 틀렸으면 어쩔 거였냐는 질문에 그래도 내 이론은 옳다고 했었을까.
[1] 인식론적으로 말하면 충분 이유의 원리에 따라 관성계 우월성을 기각한 것.[2] 철수와 영희가 동시에 공원을 반대방향을 도는 것과 비슷한 문제들을 본적이 있을 것이다.[3] 사실 메타-물리학적 고찰에 가깝다[4] 정확하게 유사-리만 기하학이다.[5] 본래 등가 원리는 관성 질량과 중력 질량이 같다는 가정 하에서 출발한다. 만약 두 질량이 같으면, 중력가속도랑 같은 크기로 가속되는 가속계를 구성할 때 가속계 속의 모든 물체는 중력에 의해 가속되는 것과 구분이 불가능하다. 두 질량이 같다는 가정이 없다면 중력장 하의 물체는 가속되는 비관성계에서의 물체와 구분할 수 있다. 예를 들어 보자. 만약 관성 질량 [math(m_{intertia})]가 중력 질량 [math(m_{gravity})]와 비례하지 않고 [math(m_{intertia}=m_{gravity}^2)]의 관계를 가진다면 중력 질량이 큰 물체는 상대적으로 느리게 가속될 것이다. 이를 통해 가속되는 우주선인지 중력을 받고 있는지 알 수 있다. 두 질량의 관계를 살펴본 가장 유명한 실험이 갈릴레이의 '피사의 사탑 실험'이다. 이 실험이 그리 개념적으로 간단한 실험은 아니다… 실험은 쉬워도. 마이컬슨 - 몰리 실험과 비슷한 시기에는 외트뵈시 실험이라고 해서 훨씬 정밀한 검증이 이루어지기도 했다.[6] 등가원리는 단일한 언명으로 이루어져있지 않다. 위의 등가원리는 일부일 뿐[7] 비전공자들이 받을 혼동을 최소화하기 위해 원래 위첨자로 써야 할 인덱스들을 전부 다 아래 첨자로 썼고 그리스 문자로 썼어야 할 것들은 그냥 알파벳으로 썼다.[8] Landau, Lifshitz - The classical theory of fields: Course of Theoretical Physics, Volume 2.[9] 이는 어떤 관측자와 지구 중심 방향으로 나란히 떨어지는 다른 물체를 생각해 봄으로서 알 수 있다. 이 관측자가 떨어지면서 자기 옆에 있는 물체를 보면, 가만히 있지 않고(즉, 자신과 완전히 평행하게 떨어지지 않고) 관측자 옆으로 슬금슬금 가속을 받으며 움직이는 것을 알 수 있다. 이는 지구 중력장이 지구 중심을 향하는 방향으로, 평행한 방향이 아니라는 이유에 기인한다. 우주 스케일로 가면 크기가 있는 물체가 받는 중력에서 이 효과는 결코 무시할 수 없는 것이다. 참고로 블랙홀에 빨려들어가면 미친 듯이 가늘어지다가 끊어지고 산산히 분해되는 것도 이 효과 때문.[10] 물리에 매우 익숙한 사람이라면 이 아이디어가 미분과 유사하다는 걸 알 수 있을 것이다. 사실, 이 아이디어로 정의되는 수학적 대상 중 하나가 바로 다양체(manifold)이며, 이 다양체를 다루는 학문이 바로 미분기하학이다. 이러니 애초부터 일반상대론은 미분기하학으로 다뤄질 수밖에 없는 학문인 셈이다.[11] 이를 최소 등가원리라고 부른다. 그리고 이것은 아인슈타인 이전부터 계속 논의되어 왔으며, 아인슈타인 이전에 실험을 시작하여 일반상대론 발표 이후까지 실험을 계속한 과학자도 있다.[12] 첫 번째 가정을 이용하는 과정은 Landau, Lipshitz의 'The classical theory of field'에서, 두 번째 가정을 이용하는 과정은 한스 오하니언의 '중력과 시공간'에서 찾을 수 있다.[13] 두 제약의 연관성도 제법 강하다. 하지만 이를 설명하기엔… 더 이상의 자세한 설명은 생략한다.[14] 사실 라그랑지안을 만들 때 조건 하나가 더 붙긴 하지만…[15] 한편, 전술하였듯이 같은 방법으로 (즉 순전히 논리적 사유만으로) 맥스웰 방정식을 '유도'해낼 수 있다! 바로 앞의 주석에서 소개한 두 책에서 이를 중력장 방정식 유도하기 전에 준비운동 겸 해서 유도하고 있다. 다만 이 내용은 아인슈타인의 업적 이후에 그 업적을 본떠서 만든 것이다.[16] 등가원리[17] 공부하면 알겠지만, 뉴턴의 중력 이론이 일반상대론의 구축에서 쓰이는 일은 비례 상수 맞추는 것하고 일반상대론의 근사가 뉴턴 법칙과 맞는다는 걸 보일 때 말고는 아예 없다. 더군다나 빛이 휘어서 온다느니 블랙홀이 있다느니 하는 내용은 훗날 관측된 것이다. 아인슈타인이 중력 이론을 새로 구축하겠다고 한 것도 어떤 관측을 보고 그걸 설명하려고 한 건 아니고 단지 뉴턴의 중력 이론과 자신의 특수상대론이 모순(뉴턴의 중력이론은 원격작용으로, 그 힘의 전달속도가 무한이기 때문에 특수상대론과 안 맞음)된다는 걸 보고 아예 중력이론을 새로 만들겠다고 해서 시작된 것이다.[18] 최종적으로 얻어진 아인슈타인의 장방정식, 즉 모든 중력을 기술하는 방정식의 모양이 너무나도 간단해서 아름답다고 할 수도 있겠지만, 이는 다소 과장이 없지 않은 게 그 방정식을 측지텐서 성분들로 분해하여 나타내면 그것만큼 끔찍한 녀석도 드물 것이기 때문이다. 표준모형은?[19] 그 연장선 상에 표준모형이 있다.[20] 여담이지만, 우주 멀미의 큰 원인 중 하나가 이것 때문이라고도 한다.[21] 그래서 국소적인 영역에서만 관성 좌표계와 같다고 저 위에서 설명한 것이다. 휘어진 공간이라도 엄청 작은 영역에서 보면 평평할 것이고, 이 영역에서는 관성 좌표계와 같다고 볼 수 있을 것이기 때문이다.[22] 사실 이건 위의 조석력을 가지고 한 사유 없이도 가져봄직한 아이디어다. 더군다나 시공간이 아예 평평하다는 것보단 더 일반적이고. 하지만 가만 생각해 보면 아무도 모르는 상태에서 시공간이 휘어져 있다는 생각을 감히 해낼 수 있을까 하는 생각도 든다.[23] 현재는 이 두 이름을 거의 사용하지 않는다. 반변벡터는 벡터, 공변벡터는 듀얼벡터 또는 1-형식이라고 한다.[24] 반변벡터는 반대로 변하고, 공변벡터는 같이 변한다는 느낌으로. 좀 더 정확히 이해하려면 아래 식에서 원래좌표 또는 바뀐 좌표가 분모와 분자 중 어느 곳에 위치하는지를 보자.[25] 스칼라 [math(S = A^{\alpha}B_{\alpha})]의 공변 도함수 [math(D_{\mu}S = D_{\mu}(A^{\alpha}B_{\alpha}))]가 편미분 [math(\partial_{\mu}S = \partial_{\mu}(A^{\alpha}B_{\alpha}))]와 같다는 것을 알면 위 식으로부터 유도할 수 있다.[26] 사실, Christoffel 기호는 접속 계수라 하여 마음대로 정의할 수 있다. 그러나 기하학적으로 가장 자연스러운 접속 계수 또한 존재한다. 이를 레비치비타 접속이라 한다.[27] 이런 경우 해당 기하를 리만 기하라고 부른다. 일반 상대성 이론에서 다룰 기하는 사실 이와 조금 다른 유사-리만 기하(pseudo-Riemann geometry)이다.[28] 위에서 주석으로 언급했듯이 실제로는 유사-리만 기하 중 하나가 바로 아인슈타인이 원하던 것이다. 실제로 상대성 이론에 적합한 유사-리만 기하을 가리켜 로렌츠 기하(Lorentz geometry)라고도 부른다.[29] 물론 [math(F_{\mu \nu} = D_\mu A_\nu - D_\nu A_\mu)]로 정의된다. 신기하게도, 공변 도함수의 정의를 그대로 정의하면 [math(D_\mu A_\nu - D_\nu A_\mu = \partial_\mu A_\nu - \partial_\nu A_\mu)]와 같다는 것을 보일 수 있다. 하지만 이런 게 모든 물리에서 나타나는 것은 또 아니다.[30] 그렇지 않아도 물리적으로 의미 있는 양이 있긴 하다. 애매하긴 하지만... 우주 상수가 바로 그것인데, 조금 있다가 다루겠다.[31] 지금 와서 이야기하는 것이지만 사실 이 가정은 처음부터 안 잡아도 됐었다. 이미 축약의 [math(\eta_{\mu \nu})]는 측지 텐서로 교체되어야 했었고 이것은 일반적인 좌표 변환을 고려했을 때 이미 상수는 아니기에 측지 텐서의 동역학, 혹은 액션을 고려해야 하긴 했었다. 여기서 좀 더 계산을 해 봐야, 즉 측지 텐서의 액션을 구해 봐야 진짜로 시공간이 평평한지 아닌지를 확실하게 말할 수 있을 것이지만 말이다.[32] 단지 리만 기하일 것인가, 로렌츠 기하일 것인가, 아니면 다른 유사-리만 기하 중 하나일 것인가 중에서 로렌츠 기하일 것인가만 정하는 게 어떻게 보면 등가원리의 전부인 것으로 보인다. 그래도 등가원리가 갖는 또 하나의 의의를 꼽자면 특수 상대성 이론에서 성립하던 물리 법칙들을 일반 상대성 이론으로 끌고 올 수 있는 동기 정도이겠다.[33] 그래서 '텐서'가 아닌 '기호'로 불리는 것이다.[34] 책마다 [math(\mu, \nu, \rho)]의 순서가 다르다. 그렇다고 해도 [math(\rho)]가 맨 앞에 있느냐 맨 뒤에 있느냐 차이뿐이다. 아무튼 주의할 것.[35] 사실 이차 도함수는 기대하지 않는 것이다. 다만 적당한 변형을 통해 이것을 일차 도함수의 제곱으로 생각할 수 있다. 다소 테크니컬하고 지금 중요하진 않은 이야기라 자세한 내용은 생략하겠다. 더 알고 싶으면 Landau, Lifshitz의 The Classical theory of Fields 93절을 참고할 것.[36] 이는 leading term이 Ricci scalar라는 것이 실험적으로 증명되었기 때문에 다음과 같이 쓴다. 또한 더 정밀한 블랙홀 솔루션을 고려하는 경우 다른 리만 텐서 또는 리치 텐서의 곱도 추가된다. Ricci 스칼라만 있는 경우는 어디까지나 퍼스트 오더 어프록시메이션이다. 이런 경우가 아닌 것은 conformal gravity, gauss bonnet gravity가 있는데 이에 대한 이야기는 arXiv를 참고하라.[37] 측지 텐서 혹은 곡률 만을 위한 액션 항은 사실상 임의로 정할 수 있다. 만약 정말로 시공간이 휘어져 있지 않다면 그 항은 0일 것이다. 반대로 라그랑지안이 얼마든지 더 복잡해 질 수도 있다. 예컨대 Ricci 스칼라의 2차 혹은 그 이상의 다항식이 될 수도 있다. 실험은 제일 간단한 1차식을 지지해 주지만. 불행하게도 양자장론에서 쓰이는 재규격화 가능성 같은 제약이 시공간의 액션에는 없다. 끈이론에는 있지 않을까