本篇文章使用的是复数欧几里得空间,其实很多的书籍教授的是采用闵可夫斯基度规的形式,但鉴于个人偏好本人只提供了一种方式的推导,物理思想是相通的,希望对采用另一种方式的同学也有点帮助。 另外,如果你需要的话,本篇文章也提供slidev(你也可以从中导出pdf等格式)。
在学习物理竞赛的过程中,我曾发现中文资料中关于狭义相对论( STR )四维矢量的文章乃至书籍都极为稀缺。鉴于此,我希望能结合个人所学,撰写一篇相关文章,以期为有志于此的同学提供一份学习参考。
为什么要使用四维矢量 #
在学习STR的时候,我时常会为各种场景的“本征”状态而烦恼,很多练习题的解析甚至是题目本身存在着一定的谬误,这也是我对场景的理解变得紊乱。可是用这种“经典”的变换式为什么会感到这么的违反直觉?究其根本,大概是我们脑中对时间,空间的理解建立在经典的伽利略时空,可是这在爱因斯坦的狭义相对论理论是行不通的,因为它的时空并不是独立的,这基于狭义相对论的两个公设:
- 光速不变原理:真空中的光速在所有惯性参考系中都是同一个常数,与光源和观察者的运动状态无关。
- 相对性原理:物理定律在所有惯性参考系中的形式都相同;不存在一个“绝对静止”的惯性系。
根据这些我们可以得到什么结论呢?
由光速不变,我们可以导出 x2+y2+z2−c2t2=0
这一结论的导出只需设想不同时间段两束光的波阵面的方程即可得到(这里不再赘述,比较不是介绍STR的基础文章)
看到这里,既然是旧有的时空体系导致了理解的复杂度,那么是否有一种方式来解决呢。答案是肯定的,闵可夫斯基就提出了这样的一种空间,因为其实狭义相对论本质上就是洛伦兹群的不变式的理论,故而只要构造这样的一种时空,便可以优雅地解决这个问题,那就是闵可夫斯基时空。
闵可夫斯基时空中的基础四维矢量 #
由上述的不变式
x2+y2+z2−c2t2=0
我们可以得到第一组四维矢量
(x,y,z,ict)
那么如何由他得到基础的洛伦兹变换呢?也即是 (x,y,z,ict) 与 (x’,y’,z’,ict’)的关系。
从一般变化式出发
x′y′z′ict′=a11a21a31a41a12a22a32a42a13a23a33a43a14a24a34a44xyzict
接下来就是考虑坐标原点 O 在 S′ 系中的运动方程
x′=a14t ,y′=a24t , z′=a34t , t′=a44t
所以有
vx′=dt′dx′=−v , vy′=dt′dy′=0 , vz′=dt′dz′=0
对坐标原点O’,应有速度关系
a11vx+a12vy+a13vz+a14=0a21vx+a22vy+a23vz+a24=0a31vx+a32vy+a33vz+a34=0
又有速度
vx=v , vy=0 , vz=0
不妨令
a44=γ
则由以上式子可以得到
x′=γx+a12y+a13z−γvty′=a22y+a23zz′=a32y+a33zt′=a41x+a12y+a13z+γt
将上式代入
x′2+y′2+z′2−c2t′2=0
再加上位置空间的各向异性得
x′2+y′2+z′2−c2t′2=x2+y2+z2−c2t2
由系数对比可知
γ=±1−β21 , β=cva41=c2γv , a12=a13=a42=a43=0a222+a232=a322+a332=1 , a22a23+a32a33=0
又因为y-z空间的变化为恒等变换,应该有
a22=a33=1 , a23=a32=0
再由v=0的变换为恒等变换可知 γ 为正
综上可得到
x′y′z′ict′=γ00−iγβ01000010iγβ00γxyzict
这就是最基础的时空坐标四维矢量,那么还有哪些比较基础的四维矢量呢
- 四维波矢
k_p=(k_x \ ,\ k_y \ , \ k_z \ , \ i\frac{\omega}{c})$$可以通过 $$kr-wt=0$$来理解
j_p=(j_x \ ,\ j_y \ , \ j_z \ , \ ic\rho)$$可以通过 $$\nabla \cdot \mathbf{j} + \frac{\partial \rho}{\partial t}=0$$来理解
pμ=(px , py , pz , icW)
其实我们可以用这些量来推导很多的四维矢量 比如四维速度,就是对时空坐标进行微分,不难得到
Uμ=dτdxμ=γ(u,ic)
不难看出
pμ=mUμ , jp=ρUp
而对于动力学,对P进行微分既可以得到四维力矢量K,这里不再赘述(btw,其实他也可以用四维加速度去得到,有兴趣的读者可以自己推导一下)
四维矢量的特性 #
其实讲了这么多,我们还是没有很好介绍一下四维矢量的特性,但这是我们后边解决实际问题的关键,下面我来介绍一下几个四维矢量的特性
洛伦兹协变性 #
这是四维矢量的一个重要性质,下面我们来推导一下
这是四维矢量的一个重要性质。在狭义相对论中,物理定律的形式在所有惯性参考系中都相同。这意味着物理量在洛伦兹变换下应保持某种不变性。四维矢量的引入正是为了在数学上实现这种不变性。对一个四维矢量 X=(x,y,z,ict) 和另一个四维矢量 Y=(x′,y′,z′,ict′).它们的内积定义为:X∘Y=xx′+yy′+zz′+(ict)(ict′)=xx′+yy′+zz′−c2tt′此内积是一个标量。在所有惯性参考系中具有相同的值。因此在洛伦兹变换下保持不变。我们来推导一下。设四维矢量 X 在 S 系中表示为列向量 X.在 S′ 中表示为 X′.且它们通过洛伦兹变换矩阵 L 相关联:X′=LX。类似地,Y′=LY。(值得注意的是,在采用虚时间分量 ict 的坐标系中,洛伦兹变换矩阵 L 是一个正交矩阵。)即它满足 LTL=I,其中 I 是单位矩阵。这个性质确保了在变换后内积的数值不变。)那么,变换后的四维矢量 X′ 和 Y′ 的内积为:X′∘Y′=(X′)TY′=(LX)T(LY)=XTLTLY由于洛伦兹变换矩阵 L 在虚时间坐标系中满足正交条件 LTL=I,因此上式变为:XTLTLY=XTIY=XTY=X∘Y这证明了洛伦兹协变性:在经过洛伦兹变换后,四维矢量的内积数值保持不变。这一特性使得我们可以通过构造洛伦兹不变量(如四维矢量的模长)来简化对物理量的处理。而不必担心选择不同的惯性参考系会导致数值变化。例如,四维矢量的模长 X∘X=x2+y2+z2−c2t2 在任何参考系中都是不变的。
一些特殊四维矢量的内积与守恒 #
- 四维速度的内积
U∘U=U∘U=−c2
- 四维动量的内积
P∘U=−m(U∘U)=−mc2=−E0 , P∘P=−m2c2
- 四维动量是守恒的
你是否注意到因为洛伦兹协变性,我们可以得到
P∘P=−(cEtot)2+p2 , P′∘P′=−(cE0)2
这就是著名的相对论能量-动量关系
Etot2=E02+p2c2
那么这样的话对光子就有
Etot=p⋅c , P∘P=0
四维矢量解决各类时空与碰撞问题的妙用 #
相对论情形下的多普勒效应 #
由四维波矢,可以得到
kx′=γ(kx−c2vω) , ky′=ky , kz′=kz , ω′=γ(ω−vkx)
即有
ω′=γω(1−cvcosθ)
这就是相对论情形下的多普勒效应
粒子碰撞堙灭产生光子 #

对各个粒子,会有以下四维动量:
- 入射粒子:
P1=γm⋅(v , 0 , 0, ic)
- 静止粒子:
P2=M⋅(0 , 0 , 0, ic)
- 垂直出射的光子束:
P3=chf1⋅(0 , 1 , 0 , i)
- 倾斜出射的光子束:
P4=chf2⋅(cos(θ) , −sin(θ) , 0 , i)
由四维动量守恒有P1+P2=P3+P4
可以得到:E1+E2=E3+E4E1⋅cv=E4⋅cos(θ)E3=−E4⋅sin(θ)
所以可以有E42−E32=E12⋅c2v2(E1+E2)⋅(E4−E3)=E42−E32E4−E3=E1+E2E12⋅c2v2
又有c2v2=1−γ21=1−E12E22=E12E12−E22
得到2⋅E4=E1+E2+E1+E2E12⋅E12E12−E22=E1+E2+E1−E2=2⋅E1
所以E1=E4E2=E3
得到了cos(θ)=cv=1−E12E22
光照射粒子产生新粒子 #

对各个粒子,会有以下四维动量:
- 入射的光:
P1=chf⋅(1 , 0 , 0 , i)
- 静止粒子
P2=M⋅(0 , 0 , 0 , ic)
- 新粒子
P3
由四维动量守恒可以得到P1+P2=P3
平方有P1∘P1+2P1∘P2+P2∘P2=P3∘P3
若原来的粒子相当中>>新的粒子,则有:0+2⋅h⋅f⋅M+(M⋅c)2≈(M+2⋅m)2⋅c2
化简就可以得到h⋅f≈2⋅m⋅c2+2⋅m2⋅c2/M=2⋅m⋅c2⋅(1+Mm)
由此可知:如果涉及的粒子是电子,那么入射量子的能量必须至少是产生粒子的静止能量的两倍。
粒子的完全非弹性碰撞生成一个新粒子 #

对各个粒子,有以下四维矢量:
- 入射粒子:
P1
- 被入射粒子:
P2
- 生成粒子 :
P3
由四维动量守恒可得:P1+P2=P3
平方可得P1∘P1+P2∘P2+2P1∘P2=P3∘P3
即为m12+2γ1γ2m1m2⋅c2(c2−v1v2)+m22=m32
这就可以得到m3
而由四维动量守恒可以得到:v3=γ1⋅m1+γ2⋅m2γ1⋅m1⋅v1+γ2⋅m2⋅v2
粒子的完全弹性碰撞 #

对各个粒子,有以下四维矢量:
- 入射粒子:
P1=γ1m⋅(v , 0 , 0, ic)
- 静止粒子:
P2=M⋅(0 , 0 , 0, ic)
- 生成粒子1:
P3=γ3M⋅(wcos(θ) , wsin(θ) , 0 , ic)
- 生成粒子2:
P4=γ4m⋅(rcos(α) , rsin(α) , 0 , ic)
由四维动量守恒有P1+P2=P3+P4
平方可以得到P1∘P1+P2∘P2+2P1∘P2=P3∘P3+P4∘P4+2P3∘P4
又因为P1∘P3+P2∘P3=P3∘P3+P4∘P3=P3∘P3+P1∘P2
可以得到P1∘P3=γ1⋅γ3⋅m⋅M⋅(c2−v⋅w⋅cos(α))P2∘P3=γ3⋅M2⋅c2,P3∘P3=M2⋅c2P1∘P2=γ1⋅m⋅M⋅c2
可以解得w=(1+mM⋅γ11)2+v2⋅cos2(α)2⋅(1+mM⋅γ11)⋅v⋅cos(α)
由能量守恒和动量守恒便可以解得了γ4=γ1+mM−mM⋅γ3rx=(γ1⋅v−γw⋅mM⋅wx)/γrwx=w⋅cos(α)β=sin−1(rx/r)
康普顿散射 #

对各个粒子,有以下四维矢量:
- 入射的光:
P1=chf⋅(1 , 0 , 0 , i)
- 静止粒子
P2=m⋅(0 , 0 , 0 , ic)
- 新粒子1
P3=chf′⋅(cos(θ) , sin(θ) , 0 , i)
- 新粒子2
P4=γm⋅(v , ic)
由四维动量守恒有P1+P2=P3+P4
平方可以得到P1∘P1+P2∘P2+2P1∘P2=P3∘P3+P4∘P4+2P3∘P4
即是P1∘P2=P3∘P4
又因为P1∘P3+P2∘P3=P3∘P3+P4∘P3=P1∘P2
即是λh⋅λ′h(1−cosθ)+m0⋅c⋅λ′h=m0⋅c⋅λh
得到了λ′−λ=m0⋅ch⋅(1−cosθ)
这就是康普顿散射的经典结论!
逆康普顿散射 #

对各个粒子,有以下四维矢量:
- 入射的光:
P1=chf⋅(1 , 0 , 0 , i)
- 高速粒子
P2=γ2m⋅(v , 0 , 0 , ic)
- 新粒子1
P3=chf′⋅(1 , 0 , 0 , i)
- 新粒子2
P4=γ4m⋅(v′ , 0 , 0 , ic)
由四维动量守恒有P1+P2=P3+P4
平方可以得到P1∘P1+P2∘P2+2P1∘P2=P3∘P3+P4∘P4+2P3∘P4
即是P1∘P2=P3∘P4
又因为P_1 \circ P_3 + P_2 \circ P_3 = P_3 \circ P_3 + P_4 \circ P_3 = P_1 \circ P_2$$即是 $$\frac{2}{\gamma_2 m c^2} \cdot h \cdot f \cdot h \cdot f' + h \cdot f' \cdot \left(1-\frac{v}{c}\right) = h \cdot f \cdot \left(1+\frac{v}{c}\right) \approx 2 \cdot h \cdot f
若v接近于c,会有h⋅f′⋅(γ2m0c21⋅h⋅f+21⋅(1−cv))=h⋅f
这就得到了f与f‘的关系!
对四维矢量的思考 #
我希望这篇基础的介绍性文章可以给你一些启示,但其实四维矢量的妙用远不只于此,鉴于篇幅问题这篇文章便想在此作结了(也许后边可以开个系列记录一下:P 我们看到四维矢量为理解相对论现象提供了统一且优雅的数学框架,希望这些可以给你一些启示与思考,也许有时候抽象的数学工具可以大大推动我们对物理的思考。
PS:对于四维矢量可不可以再中学物理竞赛使用的问题,我目前的经验是对于极其有把握的题目可以尝试,但是一旦出错不要有念想会有过程的分数,没办法物理竞赛也是应试,最基础的最经典的方法往往最受青睐(但是四维矢量用来验证还是很好的:D