閔氏幾何是什麼?它如何統一時空並極大簡化了狹義相對論?(上)

1905年,愛因斯坦正式提出了狹義相對論;1908年,閔可夫斯基給出了狹義相對論的幾何表述,也就是我們這裡說的閔氏幾何。愛因斯坦一開始對這套幾何語言很反感,認為這些純數學上的“花架子”沒什麼用,還增加了相對論的複雜度。但是,他很快就發現閔氏幾何非常重要,發現這絕不是什麼純數學技巧,而是有著深刻物理內涵的洞見。而且,如果要建立廣義相對論,少了它根本不行。


閔氏幾何是什麼?它如何統一時空並極大簡化了狹義相對論?(上)


幾何語言清晰直觀,在處理許多問題時有很大的優勢,這在雙生子佯謬裡體現得非常明顯:使用代數語言,使用洛倫茲變換去處理雙生子佯謬,其中難度之大思維之繞,絕對是對智商極大的考驗;而使用幾何語言,這個問題就簡單得不像是個問題。然而,目前絕大部分介紹相對論的書籍文章還是使用的代數語言,所以你還是能經常看到許多人在一些非常簡單的問題上糾纏不清,爭論不休。

樑燦彬老師說他上世紀80年代從“言必稱幾何”的芝加哥大學回來以後,就一直在國內大力推廣相對論的幾何語言,但是不明白為啥過了三十多年大眾對它還是很排斥。長尾科技就在這篇文章裡跟大家好好聊一聊,希望能夠解開大家跟閔氏幾何之間的心結。

因為這是從零開始的一篇文章,所以我暫時就只談相對論裡最簡單的幾何語言,也就是狹義相對論裡的閔氏幾何。至於廣義相對論裡涉及的黎曼幾何,我們後面再說。

01為什麼很多人覺得幾何語言難?

瞭解相對論的人大多知道一點閔氏幾何,知道我們可以通過畫時空圖的方式來解決一些很複雜的問題,但是他會覺得閔氏幾何很難:把時空圖畫出來很難,畫出來之後去解釋時空圖更難當看到別人對著時空圖“輕而易舉”地把問題解決了,他心裡沒底。他無法理解為什麼你說時空圖裡的這個代表了相對論的裡的那個,為什麼你對時空圖裡的一些點、線、面做這樣的處理就對應著相對論裡的那個問題。所以,他覺得你在時空圖裡做的那些幾何操作非常“虛”,他不理解這些幾何背後的實質,自然會覺得很難。

然而,這不該是幾何該給我們留下的印象啊。我們平常接觸的幾何,一個點、一條線、一個正方形、一個圓,這些都是我們日常生活裡一些形狀的完美投射,它們非常的實在,一點都不虛。很多在代數上不好理解的東西,我們把它畫到幾何圖形上一下子就理解了。幾何原本就應該比代數更加簡單直觀,但是為什麼到了相對論這裡,大家反而覺得幾何語言更加難以接受了呢?原因就是狹義相對論裡使用的幾何並不是我們熟知的歐式幾何,而是一種全新的閔氏幾何,當我們把歐式幾何裡的一些習慣和常識代入進來的時候,自然會引起各種水土不服。

所以,這裡我們先不談閔氏幾何和歐式幾何的具體區別,我們先來看看狹義相對論是怎麼和閔氏幾何對上眼了的。為什麼狹義相對論不用歐式幾何來描述,而非得使用一個我們不熟悉的閔氏幾何呢?這個問題不清楚,講再多閔氏幾何的性質也是白搭。

02兩個基本假設

為什麼狹義相對論要使用我們不熟悉的閔氏幾何,原因當然還是得從自身來找。大家都知道狹義相對論有兩條基本假設:相對性原理光速不變。從這兩個假設出發我們可以很自然的推導出狹義相對論裡各種奇奇怪怪的結論,這裡我們先來審查一下這兩個假設。


閔氏幾何是什麼?它如何統一時空並極大簡化了狹義相對論?(上)


相對性原理物理定律在所有的慣性參考系裡都是平等的,不存在一個特殊的慣性系。這一點很自然,伽利略很早就發現這點了,他意識到一個人在一個勻速移動(慣性系)的密閉船艙里根本無法區分這艘船到底是靜止的還是以某個速度勻速運動。無法區分的意思就是這兩個參考系(靜止和勻速運動)是平等平權的,否則,你就應該有辦法把它們區分開。

不同的是:伽利略只敢給力學定律打包票,他只敢說我們無法用力學實驗區分兩個慣性系,其他定律(比如電磁學實驗)能不能區分慣性系他就不敢說了。愛因斯坦說你不敢打包票我來,我打賭所有的物理定律(力學的也好,電磁學或者其他的也好)都無法區分慣性系,你在船艙裡做什麼實驗都也無法區分這艘船是靜止的還是勻速運動的。

從這裡我們可以感覺到,相對性原理好像並沒有那麼反常識,它只是把伽利略的那套相對性原理的適用範圍給擴大了。那麼,狹義相對論裡那麼多結論的“詭異”似乎就應該來自另外一個假設,也就是光速不變

光速不變真空中的光速在所有的慣性系裡都是一樣的。不論你在哪個慣性系(注意一定要是慣性系,非慣性系裡光速就沒人管它了)裡測量光速,在靜止的地面也好,飛速的火車飛船裡測也好,測得的光速都是一個定值c。

這就太反常識了,怎麼能夠在不同的參考系裡測量同一個物體的速度都相同呢?比如,在一輛速度為300km/h的高鐵上,有一個人以5km/h的速度朝車頭走去。那麼,高鐵上的人會覺得他的速度是5km/h,而地面的人會覺得他的速度是300+5=305km/h,這兩個速度肯定是不一樣的。但是,如果我把這個人換成一束光,讓這束光射向車頭,光速不變就是說不管你是在高鐵上測量,還是在地面上測量,這束光的速度都是c。你以為在地面上測量的光速應該是c+300km/h麼?對不起,並不是這樣。

你覺得這個事詭異麼?詭異!為什麼會這樣呢?不知道,光速不變是狹義相對論的一個基本假設,這個類似數學裡的公理,我們只能假設它是對的,但是卻無法證明它是對的,它的可靠性由實驗保證。其實,這個事情很多人還是知道的,但是,大多數人並不知道如果我們再深挖一下光速不變原理的祕密,我們就能找到一條通向閔氏幾何的隱祕通道

03光速不變的祕密

光速不變說你在任何慣性系中測量光速,得到的結果都是c,我們來定量的分析一下這個原理。

假設我們在K系裡測量一束光,假設這束光在Δt的時間內走了Δl的距離,那麼顯然就有Δl=Δt×c。如果我們把這束光在x,y,z三個座標軸方向移動距離的分量記為Δx,Δy,Δz,那麼根據勾股定理就有:Δl²=Δx²+Δy²+Δz²,再把這兩個式子合起來就能得到:Δx²+Δy²+Δz²-(Δt×c)²=0。如果這時候我們用一個新的量Δs²表示左邊的東西,那麼就有Δs²=Δx²+Δy²+Δz²-(Δt×c)²=0。

好,事情發展到這裡,一切都非常容易理解,上面的事情倒騰來倒騰去就是一束光在空間裡走了一段距離,然後套用了小學生都知道的距離等於速度乘以時間而已。而且,大家也會發現這個事跟光速不變也沒有什麼關係,你就是把上面的光換成一顆子彈,把光速c換成子彈的速度,那麼上面的一切推理都還是那樣的。沒錯,因為光速不變說的是光速在不同的慣性系裡都一樣,那麼我們還得再考察一個慣性系

還是上面那束光,我們這次在另一個參考系K’裡對它進行測量。假設我們測量的結果是它在Δt’的時間內走了Δl’,我們同樣對這個距離做一個分解,假設它在x,y,z三個座標軸方向移動距離的分量記為Δx’,Δy’,Δz’。根據光速不變原理,光在這個參考系裡的速度還是c,那麼,按照上面的邏輯,我們依然可以得到Δs’²=Δx’²+Δy’²+Δz’²-(Δt’×c)²=0

當我們把K和K’這兩個參考系了的結果拿來對比的時候,光速不變原理帶來的反常效應就出現了:大家有沒有發現Δs和Δs’的表達式的形式完全一致,而且值還相等(都等於0)?

我們只是把K系裡測量的時間和距離全都換成了K’系裡測量的時間和距離,其它的東西我們一概沒動。而在牛頓力學裡,ΔsΔs’的表達式形式是不一樣的,因為牛頓力學裡另一個慣性系的測量速度會加上兩個參考系之間的相對速度。也就是說在牛頓體系裡,在K’系裡測量的光速應該是c加上兩個參考系的相對速度,這樣Δs’的形式就Δs跟不完全一樣了,而相對論是用光速不變強制保證了它們的形式一致

這一點大家好好想一想,它並不難理解,但是卻是後面的關鍵。我們現在等於說是定義了一個Δs對於光來說,這個Δs的值在不同的參考系裡是相等的,剛好都是0

那麼,重點來了:如果我把這個Δs從光推廣到所有物體,我仍然從兩個不同的慣性系K和K’去測量這個物體在空間上運動的距離Δx、Δy、Δz和時間上經過的間隔Δt,然後一樣把它們組合成Δs和Δs’。那麼,這個物體的Δs和Δs’之間有沒有什麼關係呢?它們是不是還跟光的Δs和Δs’一樣相等並且都等於0呢?

是否等於0很好回答,一看就知道肯定不等於0。假設博爾特1秒鐘跑10米,那麼Δt=1、Δx=10,不考慮另外兩個維度(Δy=Δz=0),看看Δs²的表達式:Δs²=Δx²+Δy²+Δz²-(Δt×c)²=100+0+0-(1×3×10^8)²,這顯然是個非常大的負數。那麼問題的關鍵就落在在慣性系K和K’裡測量的這兩個值Δs和Δs’是否相等,也就是說,如果博爾特在跑步,我們從地面和火車上測量得到的 Δs和Δs’是否相等

這個答案我直接告訴大家:一樣

這個證明過程其實也非常簡單,這不就是同一個事件看它在不同的慣性系裡是否滿足某個式子麼?同一個事件在不同慣性系下變換關係,在相對論裡這不就是洛倫茲變換的內容麼?所以,你直接用洛倫茲變換去套一下Δs和Δs’,你很簡單就能發現它們是相等的,這裡我就不做具體計算了,當作課後習題。

所以,我們通過分析就得到了這樣一個結論:在相對論裡,不同慣性系裡測量一個物體的位移、時間等信息可能不一樣,但是它們組合起來的Δs²=Δx²+Δy²+Δz²-(Δt×c)²確是相等的,而這個值對光來說還剛好就是0

注意了,這個結論極其重要,正是它決定了為什麼我們要使用閔氏幾何來描述狹義相對論,甚至,從某種角度來說,它幾乎包含了閔氏幾何裡的全部奧祕。為了讓大家更好地瞭解這個結論背後的意義,我們先去看一看歐式幾何裡的類似情況。

04歐式幾何不變量

在歐式幾何裡也有一些量是不隨座標系的變化而變化的,比如最簡單的線段的長度

在二維的歐式幾何裡,我們假設在一個直角座標系裡有兩點A(x1,y1)、B(x2,y2),令Δx=x2-x1,Δy=y2-y1,那麼,利用勾股定理就能非常容易的算出AB之間的距離Δl²=Δx²+Δy²。這時候我們如果在建一個新的直角座標系,在這個新的座標系裡原來A、B兩點的座標變成了A(x1’,y1’)、B(x2’,y2’),同樣令Δx’=x2’-x1’,Δy’=y2’-y1’,AB之間新的距離Δl’²=Δx’²+Δy’²。這時候我們可以很輕鬆的驗證Δl=Δl’,也就是說Δx²+Δy²=Δx’²+Δy’²


閔氏幾何是什麼?它如何統一時空並極大簡化了狹義相對論?(上)


這個結論一點都不奇怪,我們都可以很直觀的感覺到,為什麼呢?因為歐式幾何就是我們日常熟悉的空間啊,我們現在就假設有一跟2米長的尺子AB,我在一個直角座標系裡計算它的長度的平方Δl²=Δx²+Δy²=2²=4,難不成我在另一個座標系裡算得它的長度的平方Δl’²=Δx’²+Δy’²還能不等於4麼?我這把尺子的長度是一定的,如果我在不同座標系下得到尺子的長度卻不一樣了,那還了得,那這幾何就有問題了。

因此,在歐式幾何裡,Δl²=Δx²+Δy²也是一個座標系不變量,這個值不隨你取座標系的變化而變化。很顯然的,如果把歐式空間從二維推廣到三維,那麼這個不變量自然就可以寫成Δl²=Δx²+Δy²+Δz²;推廣到四維,我們用t表示第四個維度,那麼Δl²=Δx²+Δy²+Δz²+Δt²,再往上推廣幾維,我就加幾個分量就行了。

大家肯定注意到了:在歐式幾何裡,不隨座標系變化的是Δl²=Δx²+Δy²+Δz²+Δt²,而我們上面在講狹義相對論的時候,不隨慣性系變化的量Δs²=Δx²+Δy²+Δz²-(Δt×c)²。這兩者非常的相似,這個光速c是個常數,可以不用考慮,為了方便計算我們甚至可以直接約定c=1,這樣的話Δl²Δs²的差別就僅僅只差一個Δt前面的負號而已。

那麼,這種形式上的相似和那個負號的差別到底意味著什麼呢?畢竟它們一個代表的是不隨慣性系的變化而變化的量(Δs²),一個代表的是歐式幾何裡不隨座標系的變化而變化的量(Δl²),一個是物理量,一個是幾何量,好像並沒有直接的關係。但是,我們這樣想想:如果我想用一種幾何來描述狹義相對論裡Δs²=Δx²+Δy²+Δz²-(Δt×c)²不隨慣性系的變化而變化的這種性質,我們肯定就不能選歐式幾何了(因為歐式幾何裡不隨座標系變化的量是Δl²=Δx²+Δy²+Δz²+Δt²)。所以我們需要一種新的幾何,在這種新幾何裡,不隨座標系變換而變化的量是類似Δs²這樣帶有一個負號的量,這種全新的幾何自然就是閔氏幾何

你這時候心裡可能有點疑惑:我們真的可以只憑借不隨參考系變化的量是Δs²和Δl²,就斷定這是兩種不同的幾何麼?Δs²和Δl²這些東西到底意味著什麼?或者說,到底是什麼決定了一種幾何?

05線元決定幾何

我們從小就在學習歐式幾何,我們學習直線、三角形、圓等很多幾何圖形,我們關心它們的各種性質,比如兩點的距離、曲線的長度、兩條線的夾角、一個圖形的面積。但是,大家有沒有想過:在歐式幾何的各種各樣的性質裡,有沒有哪個是最基本的?也就是說,我們能不能只定義這個最基本的量,其他的各種量都可以從這個量裡衍生出來?這樣的話,我們就只需要抓住這一個最基本量的性質,就可以抓住這種幾何的性質了。

答案是:有,這個最基本的量就是弧長,準確地說是組成任意曲線、弧線的基本元段長

要把這個說清楚,我們這裡得稍微引入一丟丟微積分的思想,別慌,這個很容易理解的~在歐式幾何裡,我們很容易求一根線段的長度(直角座標系裡利用勾股定理就行了),但是,如果要你求一條任意曲線的長度呢?


閔氏幾何是什麼?它如何統一時空並極大簡化了狹義相對論?(上)


比如上圖的曲線AB,這是隨手畫的很一般的一條曲線,不是什麼特殊的圓弧,你要怎麼求它的長度呢?數學家們是這麼考慮的:我在曲線AB之間取一些點,比如P1、P2、P3,然後這三個點就把這段圓弧的分成了四個部分。我們用線段把這幾個點連起來,這樣我們就得到了一條折線,這時候我們就用折線的長度(也就是這四條線段的和AP1+P1P2+P2P3+P3B)來近似代替曲線AB的長度。當然,你肯定會說,曲線的長度明顯比這四條線段加起來更長啊,你怎麼能用折線的長度來代替曲線呢?

是的,如果你只在AB之間取三個點,那麼曲線AB的長度肯定要比折線的長度多很多,這樣近似的誤差很大。但是,如果我再多取一些點呢?我在AB之間取十個、一百個甚至一千一萬個點,那麼,這成千上萬條線段組成的折線的總長度跟曲線AB比呢?當然,還是會短一些,但是,你可以想象,這時候這些折線已經跟曲線AB非常接近了。如果一根1米長的曲線被你分成了1萬條線段,這時候你用肉眼根本分辨不出來這是原來的曲線還是折線。但是你內心還是知道折線要短一些,那麼接下來就是重點了:如果我在曲線AB之間放無窮多個點呢

無窮是一個很迷人,同時也很迷惑人的詞彙。從上面的分析我們知道:當我們在曲線AB裡放越多的點,這些小線段連起來的折線就越接近曲線AB本身。那麼,當我們放了無窮多個點的時候,這無窮多個線段組成的折線是不是就應該等於曲線AB的長度了?答案是肯定的,而這,就是微積分最樸素也是最核心的思想。


閔氏幾何是什麼?它如何統一時空並極大簡化了狹義相對論?(上)


在這種思想的指導下,我們要求任意曲線的距離,最終還是要求小線段的距離,因為無窮多個小線段累加起來的長度就是曲線的長度。因此,我們只要知道如何求無窮小的線段的長度,我們就能用微積分的思想求出任意曲線的長度,我們把這個最基本小線段稱為曲線的一個元段長,記做dl


閔氏幾何是什麼?它如何統一時空並極大簡化了狹義相對論?(上)


在歐式幾何裡,我們把基本元段dl在座標系裡分解一下,用dx和dy表示dl在x軸和y軸上的分量,那麼根據勾股定理就有dl²=dx²+dy²,我們就把dl²稱之為線元

提煉出了線元這個概念以後,我們就可以開始反推了。在任何一種幾何裡,如果我們確定了線元,就等於知道了元段dl的長度,然後就可以利用上面微積分的思想求任意一段曲線的長度。那麼,接下來,我們會發現幾何裡的其他性質都可以按照這些定義。比如,我們就可以把兩點之間的距離定義為這兩點之間所有可能的曲線裡最短的一條,把兩條直線的夾角定義為弧長和半徑的比值(想象在一個圓裡,半徑固定,弧長越大角度越大),其他什麼面積、體積之類的幾何性質就都可以根據這些基本性質來定義。

最後,你會發現只要給定了一個線元,我們就能把它所有的幾何性質都確定下來,也就是說:線元決定幾何。

那麼,什麼是歐式幾何呢?歐式幾何就是由歐式線元(dl²=dx²+dy²)決定的幾何。非歐幾何呢?只要你的線元不是歐式線元,那麼這個線元決定的幾何就是非歐幾何。用這種新線元,我們一樣可以定義出在這種新幾何裡的曲線長度、兩點的距離、線的夾角等等幾何性質。


閔氏幾何是什麼?它如何統一時空並極大簡化了狹義相對論?(上)


那麼,閔氏幾何是什麼?閔氏幾何的線元又是什麼呢?

答:很顯然,閔氏幾何就是由閔氏線元決定的幾何。閔氏線元是這樣的ds²=-dt²+dx²+dy²+dz²,如果只考慮二維閔氏幾何的話,那麼ds²=-dt²+dx²。

閔氏線元(ds²=-dt²+dx²)跟歐式線元(dl²=dx²+dy²)十分相像,它們之間唯一的差別就在於閔氏線元的第一個分量dt²的前面是負號,而歐式線元全部都是正號。也因為如此,閔氏幾何歐式幾何也非常像,所以閔氏幾何還有一個稱呼,叫偽歐幾何。但是,我們也要特別注意這個負號,正是這個負號,決定了閔氏幾何和我們熟悉的歐式幾何裡所有不一樣的地方,而這些不一樣,恰恰是我們通過閔氏幾何來理解狹義相對論的關鍵。

06閔氏幾何與狹義相對論

我們現在知道了,所謂的閔氏幾何,不過是由閔氏線元ds²=-dt²+dx²+dy²+dz²決定的幾何。在這種幾何裡面,曲線的長度、兩點的距離、線的夾角等一切性質都有這個第一項帶了一個負號的閔氏線元決定

看看這個閔氏線元ds²=-dt²+dx²+dy²+dz²,再看看我們最開始提到的那個在狹義相對論裡不隨慣性系的變化而變化的量Δs²=Δx²+Δy²+Δz²-(Δt×c)²,是不是非常像?在相對論裡有兩種單位制:國際單位制幾何單位制。國際單位制就是我們平常熟悉的那一套單位制,幾何單位制就是選擇光速c=1,這樣可以大大簡化在用幾何處理相對論問題的難度。採用幾何單位制的話,不隨慣性系變化的Δs²=Δx²+Δy²+Δz²-Δt²,這就真的跟閔氏線元ds²=-dt²+dx²+dy²+dz²一模一樣了。

這就是為什麼我們要用閔氏幾何,而不是歐式幾何來描述狹義相對論的根本原因

在牛頓的世界裡,時間是絕對的,三維的空間也是絕對的,一根木棒在三維空間裡隨便怎麼變換,隨便怎麼變換參考系,它在三維空間裡的長度是一定的,這個是跟三維的歐式線元對應的(因為三維的歐式線元dt²+dx²+dy²也不隨座標系的變化而變化)。

但是,在狹義相對論裡,空間不再是絕對的,不再是一成不變的,我們熟悉的尺縮效應不就是說從不同的慣性系裡觀測同一把尺子,這個尺子的長度是不一樣的麼?這就是說空間上的“長度”在狹義相對論的不同慣性系裡不再是不變量。但是,我們發現如果把時間也考慮進來,把三維空間和一維時間一起組合成四維時空,那麼這個四維時空裡的間隔Δs²=Δx²+Δy²+Δz²-Δt²就是不隨慣性系的變化而變化的量(這個在前面說過,用洛倫茲變換可以非常方便的證明)。

閔氏幾何是什麼?它如何統一時空並極大簡化了狹義相對論?(上)


所以,在牛頓的世界裡,三維空間是絕對的,他必須保證同一把尺子在不同的三維空間的座標系里長度是一樣的,也就是說在度量三維空間里長度的方式(這個有個更專業的概念叫度規,這裡我們知道就行)必須跟座標系無關,而歐式幾何正好有這樣的特性,所以牛頓力學的背景是歐式幾何

而在狹義相對論裡,三維空間並不是絕對的,三維空間裡一把尺子的長度在不同慣性系裡是不一樣的。但是,三維空間和一維時間組成的四維時空是絕對的。四維時空裡如果也有這樣一把“尺子”,那麼這把“尺子”無論從哪個慣性系來看,它的四維“長度”都是一樣的。而狹義相對論的這種四維“長度”,或者說我們在四維時空裡度量長度的方式,它跟閔氏線元表達式的形式是一樣的。也就是說只有在閔氏幾何裡,狹義相對論的時空間隔才對應於他們幾何裡的“長度”的概念,所以我們要使用閔氏幾何來描述狹義相對論。

理解這一段非常的重要,因為只有理解了這個,你才能從根本上把閔氏幾何和狹義相對論對應起來。有很多閔氏幾何的科普文章裡上來就是直接給你畫時空圖,然後告訴你閔氏幾何裡的這種圖形這個幾何性質對應著狹義相對論裡的這種概念,這樣很多人就感覺難以接受,然後對幾何語言產生牴觸的心理。

好,既然我們打算用閔氏幾何來描述狹義相對論,那麼肯定就要把狹義相對論裡的物理語言翻譯成閔氏幾何裡的幾何語言。幾何肯定是離不開畫圖的,在歐式幾何裡我們經常會畫出一個幾何圖形在空間上的樣子,這是空間圖。而狹義相對論把時間和空間看作一個整體, 它要求我們以同等的地位來看待時間和空間,所以我們需要畫出一個事件同時在時間和空間裡的樣子,這種圖就叫時空圖

07時空圖

在時空圖裡,你能非常自然地感覺到時間和空間被統一起來了,因為時空圖裡的時間軸和空間軸有著完全的平等的地位


閔氏幾何是什麼?它如何統一時空並極大簡化了狹義相對論?(上)


在時空圖裡,一個粒子現在在哪,你找到它的空間座標(x,y,z),記下現在的時間t,那麼你就得到了它的時空信息(x,y,z,t),那這個時空信息就對應時空圖裡的一個點,這就叫時空點

同樣的,你再記下它下一個時刻t1的位置(x1,y1,z1),那麼它又對應了座標系的另一個點(x1,y1,z1,t1)。所以,一個粒子在任一時刻的時間、空間信息就都對應了時空圖裡的一個點。那麼,如果考察這個粒子的全部歷史,你就可以得到一系列的這種時空點,這些點在時空圖裡就會形成一條線,這條能代表粒子全部歷史的線就叫粒子的世界線

現實生活裡一個粒子有四個維度(三維空間+一維時間),那麼對應的座標軸應該也是四維的,但是我們在二維平面裡勉強可以畫出三維圖形,對四維圖形實在無能為力。為了方便起見,我們假設粒子只沿x軸方向運動,這樣我們就可以不考慮y軸和z軸的情況,從而把四維的問題簡化為二維,然後我們就可以很愉快的在一張二維的紙上畫這二維時空圖了。

我們先建立一個座標系,橫軸x代表粒子的空間信息,縱軸t代表粒子的時間信息。為了再次簡化問題,我們採用幾何單位制,也就是取光速c=1,然後我們再來看一些具體問題。

問題1一個靜止不動的粒子在時空圖裡是什麼樣的?或者說它的世界線是什麼樣的

這個答案很容易想到,一個粒子靜止不動,就是在空間上沒動,那麼它的x座標一直為零,但是時間依然在流逝,也就是粒子的時間座標在一直變大。所以,靜止不動的粒子是世界線是一條跟t軸重合,垂直於x軸的直線


閔氏幾何是什麼?它如何統一時空並極大簡化了狹義相對論?(上)


問題2:一個勻速向右運動的粒子的世界線是什麼樣的

這個也不難想象,一個勻速向右運動的粒子,它在時間軸不停往上走的同時,空間軸上也在不停地往右走,那麼這個粒子的世界線應該是一條斜直線。問題是,斜多少?是所有的座標空間它都可以斜,還是有什麼限制?這個問題我們先放著,先看看第三個問題。

問題3:一條朝右上方45°的斜直線(如下圖的L1)代表了什麼粒子的世界線


閔氏幾何是什麼?它如何統一時空並極大簡化了狹義相對論?(上)


我們先來算一算這個粒子的速度:我們在粒子的世界線L1上取兩個點,也就是假設粒子在t1時刻在位置x1,在t2時刻在位置x2。因為這條直線是45°的,所以很顯然x2-x1=t2-t1,.那麼粒子的速度v=(x2-x1)/(t2-t1)=1

速度等於1是什麼意思?我們在畫圖的時候採用的是幾何單位制,也就是取光速c=1(如果我們不採用幾何單位制,那麼豎軸的單位就不是t,而是ct,本質並沒有什麼不同)。現在這個粒子的速度等於1,其實就是代表這個粒子的速度是光速,速度是光速那自然就是光子了,那麼這條45°斜直線就代表了光子的世界線

從這裡我們可以看到,在時空圖裡,光子的世界線是45°的斜直線。我們也知道在相對論裡任何有質量粒子的速度都是小於光速的,那麼一個有質量的粒子做勻速直線運動的世界線該是一條什麼樣的斜直線呢?是在區域1還是區域2

我們可以這樣想一下:如果粒子的速度比光速小,那麼假設粒子在t1時刻在x1處,那麼到了t2時刻它肯定到不了x2地方,那麼這兩點的連線肯定就在L1的上方,也就是區域1。其實我們也可以想一個極端的粒子,假設這個粒子在原點不動,那麼粒子的世界線就是跟t軸重合,粒子速度到達光速就是45°的那條直線,那麼速度在靜止和光速之間的粒子世界線自然就是在區域1的斜直線了。

現在我們知道了這樣一個結論:在時空圖裡,45°的斜直線代表了光子的世界線(如L1),比光子世界線更陡,更加靠近t軸的斜直線(如L2)是有質量粒子勻速直線運動,或者說慣性運動(速度小於光速)的世界線。


閔氏幾何是什麼?它如何統一時空並極大簡化了狹義相對論?(上)


有了這樣的基本認識,我們來用幾何語言分析一下狹義相對論裡入門教材裡必定會碰到的問題:火車閃光問題。這個問題之所以重要,是因為它揭示了同時的相對性,也就是說在一個慣性系看來是同時發生的事件,在另一個參考系裡不一定是同時發生的。愛因斯坦敏銳地發現了這點,然後藉此從看似牢不可破的牛頓力學裡撕開了一道口子。

08同時的相對性

在牛頓力學裡,時間是絕對的,所以同時必然也是一個絕對的詞彙。在一個參考系看來是同時發生的事件,不管誰來看都絕對是同時發生的,這也是一個非常符合常識的論述。

但是,愛因斯坦用一個簡單的火車實驗就讓人們的這個信念坍塌了,這個實驗是這樣的:假設地面上有一輛勻速運動的火車,在某一個時刻,地面上的觀察者發現這個火車的車頭和車尾同時被閃電擊中。也就是說,對於地面參考系而言,閃電擊中車頭和車尾這兩個事件是同時發生的。但是,愛因斯坦認為在火車參考系裡,這兩個事件就不是同時發生的。

原因也很簡單,我們假設在閃電擊中火車頭尾的時候,在地面這兩點的中點有一個觀察者。因為兩個事件在地面系看起來是同時發生的,所以,站在地面中間的那個觀察者肯定會同時看到車頭和車尾發過來的閃光,所以這兩個事件是同時的。

但是,站在火車中間的觀察者就不是這樣了,因為車頭車尾的閃光在向中間傳播的時候,火車本身也在前進,所以火車中間的人就會先看到車頭髮過來的閃光,後看到車尾發過來的閃光。所以,火車上的觀察者就會覺得這閃電擊中車頭和車尾這兩個事件不是同時發生的,而是擊中車頭的先,擊中車尾的後。


閔氏幾何是什麼?它如何統一時空並極大簡化了狹義相對論?(上)


愛因斯坦從這個火車閃光實驗出發,發現了同時的相對性,進而打開了狹義相對論的大門。這個實驗比較簡單,整個邏輯過程也不復雜,但是這樣講不夠直觀,不夠具有普遍性。因為很多人會把這個實驗當做一個特例來處理,也就是只有當他們意識到要講同時的相對性的時候才會想起這個實驗,平常就會把這個實驗帶來的同時的相對性給忘了,然後帶來一系列的“相對論詭異疑難”。下面我們從幾何語言來看看這個問題,看看如何讓這個重要問題更直觀,更具有普遍性。

我們假設閃電同時擊中車頭車尾(從地面系觀測)的時候,火車的車尾M’、車頭N’剛好經過地面的M和N點,P點為地面MN的中點,P’為火車上的中點,我們來看看怎麼在時空圖上描述這個閃電擊中火車的問題。

我們先來看看地面上M和N點的世界線,因為M、N在地面上沒有動,所以M和N點的世界線都是一條沿著時間軸t豎直向上的直線(空間位置沒動,只有時間t在動)。同樣的,在MN中間的P點也沒動,它的世界線也是一條豎直向上的直線。這三條線好畫,那麼在火車上的M’、N’和P’,它們都在做勻速直線運動,那它們的世界線是什麼樣的呢?這個我們上一節剛好說了,做勻速運動的粒子的世界線是一條比45°線更陡的斜直線。那我們把這六個點的世界線都畫出來,不難理解應該就是下面這樣(橫軸為空間x,縱軸為時間t,這裡省略了)。


閔氏幾何是什麼?它如何統一時空並極大簡化了狹義相對論?(上)


下面是關鍵的了,怎麼畫車頭、車尾的閃光向中點傳播的過程?我們知道,閃電擊中車頭車尾之後,這個事件就會向四面八方發射光信號(所以四面八方的人都能看到火車被閃電擊中了),但是,其他的信號我們都不關心,我們只關心被地面中點P和火車中點P’所接收到的那一束光信號。那麼,這個光信號要怎麼畫呢?它們的出發點肯定在m和n,那接下來呢?這次我們再次想起了上一節中提到的:光子的世界線是45°的斜直線。那麼我們就加上這兩條45°的世界線,最後的圖就是下面這樣的。


閔氏幾何是什麼?它如何統一時空並極大簡化了狹義相對論?(上)


這兩根世界線跟兩個中點P、P’的世界線產生了三個交點A、B、C,這是三個很有意思的點,我們來分析一下它們的物理含義。

首先是A點,A點是閃光世界線跟地面中點P點的世界線交點,它們相交了是什麼意思?縱軸代表時間,橫軸代表空間,相交了就代表這兩個粒子此時時間和空間信息都一樣,都一樣那就是相遇了啊,具體到我們這個問題就是閃光傳播到了地面上的中點。因為地面沒有動,M和N點到P點的距離又是一樣的,那麼車頭車尾的閃光肯定同時到達地面中點,所以它們都相交於A點是正確的。

再來看B點和C點。B點是車尾的閃光的世界線和火車裡面的中點P’世界線的交點,那B點代表的意思自然就是火車中間的觀察者觀察到車尾的閃光這個事件。同理,C點是車頭閃光世界線跟P’世界線的交點,那C點就是火車中間的觀察者觀察到車頭閃光的這個事件。這樣看就非常明顯了,縱座標是時間軸,那麼B事件明顯就是在C事件之後發生的啊。

這正是同時的相對性的表現:對於地面系,它們都交於A點,所以是同時的;對於火車系,它們分別交於B點C點,所以是不同時的,這在時空圖裡極為直觀。

這裡有一個事要強調一下:我們在這個火車閃光問題裡雖然涉及到了地面系和火車系,但是我們是一直在地面系來分析問題的。我們畫的時空圖,不管是地面上的點還是火車上的點,我們都是在地面系畫,因為畢竟一張圖只有一個座標系嘛。那麼,我們能不能在一張圖裡同時把地面系和火車系兩個慣性系都畫上呢

答案當然是可以的。

09兩個座標系

我們來具體看看這個問題:假設我們現在已經畫了一個地面系的直角座標系x-t,那麼我們要如何把火車系的座標系x’-t’畫出來


閔氏幾何是什麼?它如何統一時空並極大簡化了狹義相對論?(上)


第一次遇到這個問題的同學可能有點懵,不著急我們一步步來,我們先看看火車系的縱軸t’要怎麼畫。要畫火車系的縱軸,我們先想想一個座標系的縱軸的是什麼意思?我們知道如果我們讓一個點的橫座標為零,那麼這個點的軌跡就是跟縱軸重合的。還記得我們上面說的靜止粒子的世界線麼?靜止粒子的空間座標x為0,所以它的世界線就是垂直於x軸,與t軸重合的一條直線。那麼,火車系的t’軸自然也是在火車系裡靜止在原點處粒子的世界線

這一點很重要,大家好好理解一下,也就是說我們只要把火車系處於原點處粒子的世界線畫出來,我們就能得到火車系的t’軸。那麼,一個在火車系靜止的點,在地面系看來它是在做勻速直線運動,而勻速直線運動的點的世界線,我們上面也說了,就是一條比45°更陡的斜直線。所以,火車系的t’軸就是這樣一條更陡的斜直線,如下圖所示:


閔氏幾何是什麼?它如何統一時空並極大簡化了狹義相對論?(上)


火車系的t’軸畫好了,那火車系的x’軸呢?大家可以看到我在圖上用虛線畫了一根與t’垂直的軸,並且特意標明瞭“錯誤的x’軸”。為什麼要這樣標呢?因為這是相對論初學者極容易犯的錯誤。我們已經習慣了歐式幾何,歐式幾何裡直角座標系都是相互垂直的,所以到了這裡很多人看到我們已經畫出了t’軸,就立馬條件反射地畫一根和t’軸垂直的當做x’軸,但是這是錯誤的,為什麼呢?

這裡我們第一次感受到了閔氏幾何的異樣。我在最開始花了那麼大的篇幅告訴大家為什麼狹義相對論要使用閔氏幾何,我們也知道了閔氏幾何的線元跟歐式幾何不一樣(時間項前面多了一個負號),所以,我們在畫時空圖處理狹義相對論問題的時候,一定要意識到自己雖然是在歐式平面裡畫圖,但是我們畫的是閔氏幾何裡的圖形

有人可能會有點疑問,我們前面不是已經用時空圖解決了同時的相對性問題麼?我們不是已經把愛因斯坦火車閃光問題用時空圖畫出來了麼,我沒感覺啥異樣啊?那只是因為那個問題比較簡單:它只有一個座標系,而且也不涉及到線長相關的問題,所以我即便在一個歐式直角座標系裡把它畫出來了,它也暫時沒什麼衝突。如果我們生活在一個閔氏空間裡,那麼我們畫出的閔氏直角座標系肯定都是相互垂直的,但是我們生活在歐式空間裡,我已經用一個歐式空間裡的直角座標系畫了一個閔氏座標系,那麼另一個就肯定不可能再是垂直的了。

這裡的邏輯有點繞,大家可以細細品味,搞得不是很懂也不要緊,我接下來會把另一個座標系畫出來,大家能看懂再回去看上面的一段話就明白了。

好,回到正題,我們再來看看火車系正確的x’軸該怎麼畫。我們再來整體回顧一下這個事情:我們現在是已經畫好了地面系x-t,要畫火車系x’-t’,火車系和地面系它有沒有什麼關係呢?有啊,洛倫茲變換說的不就是地面系和火車系的關係麼?什麼是洛倫茲變換?比如我在地面系觀測到了一個粒子的位置和速度,現在我想知道它在火車系裡是什麼情況,我並不需要重新再到火車系裡測量一遍這個粒子的位置和速度,我只需要根據洛倫茲變換就可以直接得到火車系裡那個粒子的運動情況。所以,洛倫茲變換就是兩個慣性系之間的聯繫,我只要知道了一個慣性系裡粒子的運動情況,立馬我就可以知道其他慣性系裡粒子運動的情況。

所以,我們可以根據洛倫茲變換來找到兩個慣性系之間的聯繫。我現在不是根據地面系的座標軸來找火車系的座標軸麼?我們對著洛倫茲變換改就是了。洛倫茲變換是下面這樣的:


閔氏幾何是什麼?它如何統一時空並極大簡化了狹義相對論?(上)


其中,x,y,z,t代表地面系裡觀測到的,x’,y’,z’,t’是火車系裡觀測到的。v是火車系相對地面系的速度,火車的速度一旦給定了,這個v就是一個定值,c是光速,所以右邊的γ都是一個常數。如果我們再根據幾何單位制來,取c=1,那麼洛倫茲變換就可以簡化成下面的樣子:


閔氏幾何是什麼?它如何統一時空並極大簡化了狹義相對論?(上)


因為我們只考慮火車系相對地面系在x軸方向上的運動,所以在y和z方向上還跟原來一樣,我們可以不考慮。我們現在畫圖也是來畫x-t圖,所以我們重點關注這兩個式子:


閔氏幾何是什麼?它如何統一時空並極大簡化了狹義相對論?(上)


這是什麼呢?這不就是火車系了的x’和t’麼?我現在要畫的就是x’的座標軸,也就是火車系的空間座標軸,那怎麼找到這個座標軸呢?這個我們前面也提過:縱座標的那條線就是橫座標為0的所有點的集合,反過來也是,橫座標就是縱座標為0的點的集合。所以,我們令火車系的時間等於0,也就是縱座標t’=0就能找到橫座標x’軸了

那我們令t’=γ(t-vx)=0,因為γ是一個不為零的常數,所以就只有t-vx=0了,也就是t=vx

這在x-t座標系裡就是一條過原點的直線,斜率為火車的速度v(斜率就是這條直線的傾斜程度,你可以理解為一個坡越陡斜率越大。當直線與橫軸重合的時候,斜率為0;當直線跟橫軸成45°的時候,斜率為1;當直線跟縱軸重合的時候,斜率為無窮大)。因為我們這裡是幾何單位制,光速為1,在狹義相對論裡任何有質量的物體它的運動速度都是小於光速的,所以火車的速度v肯定是小於1的,也就是說這條直線的斜率比45°的直線(剛好是光的世界線)小。

再者,我們可以用同樣的方法令x’=γ(x-vt)=0,就能得到火車系的縱軸是這樣一條直線:t=x/v。它的斜率是1/v,因為v小於1,所以1/v是個大於1的數,所以這條斜直線的斜率比45°要大(我們前面畫的也正是這樣)。這裡我給一個初中數學的結論:斜率互為倒數(比如v和1/v)的兩條直線它們是關於y=x,也就是45°的直線對稱的。所以,我們的x’軸是跟t’軸關於45°的直線對稱的。這樣我們就能精確地把它畫出來了,如下圖:


閔氏幾何是什麼?它如何統一時空並極大簡化了狹義相對論?(上)


第一次看到這樣一個座標系的同學可能會感覺非常彆扭,為什麼火車系x’-t’的座標系不是正交的,不是一個直角呢?我們得這樣看:它們是正交的,只不過它們是在閔氏幾何里正交,我們現在強行把它畫在歐式幾何裡,那麼肯定就看起來不正交了

還有同學也會有疑惑,你不是說狹義相對論裡慣性系都是平權的麼?那麼為什麼這裡把地面系畫成直角的,而把火車系畫成了一個小於直角的座標系?我要是人就在火車裡,我非要把火車系畫成直角的,不行麼?行,當然行。你可以按照上面的思路把火車系畫成直角的基準系,再反推過去畫地面系,最終的兩個圖雖然形狀不一樣,但是實質上還是等價的。

理解這個雙座標系非常關鍵,它第一次向我們展示了閔氏幾何不一樣的地方。有了它,我們就可以很方便的處理不同慣性系裡的一些事情,比如,我們喜聞樂見的尺縮效應。

10尺縮效應

……

文章太長只能分兩篇,剩餘部分見下篇~

下篇:閔氏幾何是什麼?它如何統一時空並極大簡化了狹義相對論?(下)

相關推薦

推薦中...