深入理解 Riemannian 几何:从流形到测地线
如果你对 normalizing flows 感兴趣,尤其是最近的研究将它扩展到流形上(比如 Riemannian Continuous Normalizing Flows, RCNFs),那么理解 Riemannian 几何是绕不过去的门槛。别担心,今天我们会一步步拆解这段文字里的数学概念,带你走进这个“弯曲空间”的世界。准备好了吗?让我们从基础开始,逐步深入!
本文基于paper:Riemannian Continuous Normalizing Flows (https://arxiv.org/pdf/2006.10605)
什么是流形(Manifold)?
Riemannian 几何的基础是流形。简单来说,流形 ( M M M ) 是一个点集 ( z z z ),它的局部看起来像我们熟悉的线性空间(比如二维平面或三维空间),但整体可能弯曲。举个例子:
- 二维平面是一个平坦的流形,局部和整体都像 ( R 2 \mathbb{R}^2 R2 )。
- 地球表面(球面)是一个二维流形,局部像平面,但整体是个球。
- 一个甜甜圈表面(环面)也是二维流形,但形状更复杂。
数学上,流形 ( M M M ) 是一个光滑的集合,每个点 ( z ∈ M z \in M z∈M ) 都带有一个切空间 ( T z M T_zM TzM ),它的维度和流形一样。切空间是什么?想象你在球面上某个点 ( z z z ),切空间 ( T z M T_zM TzM ) 包含所有可能通过这个点“切向经过”的方向。比如在地球表面,切空间是个二维平面,包含南北、东西方向的所有线性组合。
所有切空间的集合构成切丛(tangent bundle):
T M = ⋃ z ∈ M T z M TM = \bigcup_{z \in M} T_zM TM=z∈M⋃TzM
Riemannian 度量:给流形加上“尺子”
流形本身只是个抽象的形状,要计算距离、角度或者体积,我们需要一个“尺子”——这就是 Riemannian 度量(metric tensor) ( g ( z ) g(z) g(z) )。对于每个点 ( z z z ),度量 ( g ( z ) g(z) g(z) ) 定义了切空间 ( T z M T_zM TzM ) 上的内积:
g ( z ) : T z M × T z M → R , ⟨ u , v ⟩ z = g ( z ) ( u , v ) g(z): T_zM \times T_zM \to \mathbb{R}, \quad \langle u, v \rangle_z = g(z)(u, v) g(z):TzM×TzM→R,⟨u,v⟩z=g(z)(u,v)
其中 ( u , v ∈ T z M u, v \in T_zM u,v∈TzM ) 是切向量,( ⟨ ⋅ , ⋅ ⟩ z \langle \cdot, \cdot \rangle_z ⟨⋅,⋅⟩z ) 是内积。
这个内积可以用矩阵表示。设 ( G ( z ) G(z) G(z) ) 是度量张量的矩阵形式,那么:
⟨ u , v ⟩ z = u T G ( z ) v \langle u, v \rangle_z = u^T G(z) v ⟨u,v⟩z=uTG(z)v
在欧几里得空间中,( G ( z ) G(z) G(z) ) 就是单位矩阵 ( I I I ),但在弯曲的流形上,( G ( z ) G(z) G(z) ) 会随 ( z z z ) 变化,反映空间的局部几何。
有了度量,一个流形就变成了 Riemannian 流形,记作 ( ( M , g ) (M, g) (M,g) )。它赋予了我们计算以下东西的能力:
- 长度:切向量 ( u u u ) 的范数是 ( ∥ u ∥ z = ⟨ u , u ⟩ z \|u\|_z = \sqrt{\langle u, u \rangle_z} ∥u∥z=⟨u,u⟩z )。
- 角度:两个切向量 ( u , v u, v u,v ) 的夹角由 ( cos θ = ⟨ u , v ⟩ z ∥ u ∥ z ∥ v ∥ z \cos\theta = \frac{\langle u, v \rangle_z}{\|u\|_z \|v\|_z} cosθ=∥u∥z∥v∥z⟨u,v⟩z ) 给出。
- 体积元素:度量诱导出流形上的测度 ( d V o l ( z ) = ∣ G ( z ) ∣ d L e b ( z ) dVol(z) = \sqrt{|G(z)|} dLeb(z) dVol(z)=∣G(z)∣dLeb(z) ),其中 ( d L e b ( z ) dLeb(z) dLeb(z) ) 是勒贝格测度。
曲线长度与测地线:流形上的“直线”
在欧几里得空间中,直线的长度是两点间的欧氏距离。但在流形上,曲线 ( γ : [ 0 , 1 ] → M \gamma: [0,1] \to M γ:[0,1]→M ) 的长度要用积分定义:
L ( γ ) = ∫ 0 1 ∥ γ ′ ( t ) ∥ γ ( t ) d t L(\gamma) = \int_0^1 \|\gamma'(t)\|_{\gamma(t)} \, dt L(γ)=∫01∥γ′(t)∥γ(t)dt
其中 ( γ ′ ( t ) = d γ d t \gamma'(t) = \frac{d\gamma}{dt} γ′(t)=dtdγ ) 是曲线的切向量,( ∥ ⋅ ∥ γ ( t ) \|\cdot\|_{\gamma(t)} ∥⋅∥γ(t) ) 是由 ( g ( γ ( t ) ) g(\gamma(t)) g(γ(t)) ) 诱导的范数。
那么,流形上的“直线”是什么?这就是测地线(geodesic)。测地线是连接两点 ( z , y ∈ M z, y \in M z,y∈M ) 的最短路径,满足:
γ ∗ = arg min L ( γ ) , γ ( 0 ) = z , γ ( 1 ) = y , ∥ γ ′ ( t ) ∥ γ ( t ) = 1 \gamma^* = \arg\min L(\gamma), \quad \gamma(0) = z, \gamma(1) = y, \quad \|\gamma'(t)\|_{\gamma(t)} = 1 γ∗=argminL(γ),γ(0)=z,γ(1)=y,∥γ′(t)∥γ(t)=1
测地线的速度是常数,类似于平面上匀速直线运动。例如:
- 在平面 ( R 2 \mathbb{R}^2 R2 ) 上,测地线就是直线。
- 在球面上,测地线是大圆(比如飞行航线)。
距离与指数映射:流形上的导航工具
测地线定义了流形上的距离:
d M ( z , y ) = inf L ( γ ) d_M(z, y) = \inf L(\gamma) dM(z,y)=infL(γ)
其中 ( γ \gamma γ ) 是所有连接 ( z z z ) 和 ( y y y ) 的曲线。这使得 ( ( M , d M ) (M, d_M) (M,dM) ) 成为一个度量空间。
现在,假设你在点 ( z z z ),想沿着某个方向 ( v ∈ T z M v \in T_zM v∈TzM ) “直线”移动,怎么办?这就需要指数映射(exponential map)。对于初始条件 ( γ ( 0 ) = z \gamma(0) = z γ(0)=z )、( γ ′ ( 0 ) = v \gamma'(0) = v γ′(0)=v ) 的唯一单位速度测地线 ( γ \gamma γ ),指数映射定义为:
exp z ( v ) = γ ( 1 ) \exp_z(v) = \gamma(1) expz(v)=γ(1)
直观来说,( exp z ( v ) \exp_z(v) expz(v) ) 把切空间的向量 ( v v v ) “映射”到流形上的一个点。比如在球面上,从北极沿某个方向移动一定距离,你会到达一个新位置。
反过来,对数映射(logarithm map)是指数映射的逆:
log z ( y ) = exp z − 1 ( y ) : M → T z M \log_z(y) = \exp_z^{-1}(y): M \to T_zM logz(y)=expz−1(y):M→TzM
它告诉你从 ( z z z ) 到 ( y y y ) 的“方向”和“距离”。
如果流形是测地完备的(geodesically complete),即所有测地线可以无限延伸,那么 ( exp z \exp_z expz ) 在整个 ( T z M T_zM TzM ) 上都定义良好。文中提到 Poincaré 球和超球面都是测地完备的,这保证了这些操作的可靠性。
常曲率流形:Poincaré 球和超球面
Riemannian 几何的一个重要子类是常曲率流形,即曲率在整个流形上恒定。曲率衡量空间的“弯曲程度”,有三种情况:
- 零曲率:平面 ( R n \mathbb{R}^n Rn ),度量 ( G ( z ) = I G(z) = I G(z)=I ),测地线是直线。
- 正曲率:超球面(hypersphere),如单位球面 ( S n = { z ∈ R n + 1 ∣ ∥ z ∥ = 1 S^n = \{ z \in \mathbb{R}^{n+1} \mid \|z\| = 1 Sn={ z∈Rn+1∣∥z∥=1 } )。测地线是大圆,曲率恒为正。
- 负曲率:Poincaré 球,如单位盘 ( B n = { z ∈ R n ∣ ∥ z ∥ < 1 B^n = \{ z \in \mathbb{R}^n \mid \|z\| < 1 Bn={ z∈Rn∣∥z∥<1 } ) 配上双曲度量。测地线是圆弧,曲率恒为负。
在 Poincaré 球中,度量是 ( G ( z ) = 4 ( 1 − ∥ z ∥ 2 ) 2 I G(z) = \frac{4}{(1 - \|z\|^2)^2} I G(z)=(1−∥z∥2)24I ),靠近边界时距离被放大;在超球面中,度量继承自欧几里得空间的嵌入。这些几何特性直接影响测地线和距离计算。
为什么关心这些?
在 RCNFs 中,Riemannian 几何提供了在流形上定义概率分布的工具。基分布的“粒子”通过向量场演化,而向量场和数值求解器必须尊重流形的度量和测地线。这比传统的投影方法(从欧几里得空间映射到流形)更自然,也更稳定。
比如:
- 在超球面上模拟地震位置分布,测地线是大圆,指数映射帮你导航。
- 在 Poincaré 球上建模层次数据,负曲率让分布自然展开。
总结
Riemannian 几何用流形 ( M M M ) 和度量 ( g g g ) 描述弯曲空间,切空间 ( T z M T_zM TzM ) 定义方向,测地线和指数映射提供“直线”和“导航”。对于常曲率流形如 Poincaré 球和超球面,这些工具让概率建模更贴合数据的内在几何。
数学符号解释
( T z M × T z M → R T_zM \times T_zM \to \mathbb{R} TzM×TzM→R ) 是什么意思?
首先,( T z M T_zM TzM) 是流形 ( M M M ) 在点 ( z z z ) 处的切空间(tangent space)。它是一个向量空间,包含所有从 ( z z z ) 点出发的“切向方向”。比如,在一个二维球面上,( T z M T_zM TzM ) 是一个二维平面,里面的向量可以表示东南西北方向的组合。
( T z M × T z M T_zM \times T_zM TzM×TzM ) 表示两个切空间的笛卡尔积。在数学上,( A × B A \times B A×B ) 是集合 ( A A A ) 和 ( B B B ) 的所有有序对 ( ( a , b ) (a, b) (a,b) ) 的集合。所以:
- ( T z M × T z M = { ( u , v ) ∣ u ∈ T z M , v ∈ T z M } T_zM \times T_zM = \{ (u, v) \mid u \in T_zM, v \in T_zM \} TzM×TzM={(u,v)∣u∈TzM,v∈TzM} )
- 意思是:取 ( T z M T_zM TzM ) 中的任意两个向量 ( u u u ) 和 ( v v v ),组成一个有序对 ( ( u , v ) (u, v) (u,v) )。
接下来,( T z M × T z M → R T_zM \times T_zM \to \mathbb{R} TzM×TzM→R ) 表示一个映射(函数),它把 ( T z M × T z M T_zM \times T_zM TzM×TzM ) 中的每一个有序对 ( ( u , v ) (u, v) (u,v) ) 映射到一个实数 ( R \mathbb{R} R )。这个映射就是 Riemannian 度量 ( g(z) ) 的作用。具体来说:
- 输入:一对切向量 ( ( u , v ) (u, v) (u,v) )。
- 输出:一个实数,表示 ( u u u ) 和 ( v v v ) 在点 ( z z z ) 处的“内积”。
这里的“相乘”并不是 ( u u u ) 和 ( v v v ) 向量直接相乘(比如点积或叉积),而是指 ( g ( z ) g(z) g(z) ) 作为一个工具,作用于 ( u u u ) 和 ( v v v ),计算它们之间的某种“关系”——这个关系就是内积。
( g ( z ) ( u , v ) g(z)(u, v) g(z)(u,v) ) 是什么意思?
( g ( z ) g(z) g(z) ) 是流形 ( M M M ) 在点 ( z z z ) 处的 度量张量(metric tensor)。它是一个双线性函数,定义在切空间 ( T z M T_zM TzM ) 上。让我们分解一下:
-
( g ( z ) g(z) g(z) ) 的本质:
- ( g ( z ) g(z) g(z) ) 是一个函数,它依赖于点 ( z z z ),因为流形的几何性质(如曲率)可能随位置变化。
- 它的输入是两个切向量 ( u , v ∈ T z M u, v \in T_zM u,v∈TzM ),输出是一个实数。
- 数学上,( g ( z ) : T z M × T z M → R g(z): T_zM \times T_zM \to \mathbb{R} g(z):TzM×TzM→R ) 表示 ( g ( z ) g(z) g(z) ) 是一个从 ( T z M × T z M T_zM \times T_zM TzM×TzM ) 到实数的映射。
-
( g ( z ) ( u , v ) g(z)(u, v) g(z)(u,v) ) 的写法:
- ( g ( z ) ( u , v ) g(z)(u, v) g(z)(u,v) ) 表示 ( g ( z ) g(z) g(z) ) 作用于 ( ( u , v ) (u, v) (u,v) ) 这个有序对。
- 这里的括号 ( ( u , v ) (u, v) (u,v) ) 表示 ( u u u ) 和 ( v v v ) 是 ( g ( z ) g(z) g(z) ) 的两个参数,不是 ( g ( z ) g(z) g(z) ) 和 ( ( u , v ) (u, v) (u,v) ) 相乘。
- 你可以把 ( g ( z ) g(z) g(z)) 想象成一个“机器”,输入 ( u u u ) 和 ( v v v ),输出一个数。这个数就是 ( u u u ) 和 ( v v v ) 在 ( z z z ) 点的内积,记作 ( ⟨ u , v ⟩ z \langle u, v \rangle_z ⟨u,v⟩z )。
-
不是相乘:
- ( g ( z ) ( u , v ) g(z)(u, v) g(z)(u,v) ) 不是 ( g ( z ) g(z) g(z) ) 和 ( ( u , v ) (u, v) (u,v) ) 的某种乘法运算,而是函数 ( g ( z ) g(z) g(z) ) 对输入 ( ( u , v ) (u, v) (u,v) ) 的计算结果。
- 在数学中,函数作用于参数时常用这种记号,比如 ( f ( x ) f(x) f(x) ) 是 ( f f f ) 作用于 ( x x x )。这里 ( g ( z ) ( u , v ) g(z)(u, v) g(z)(u,v) ) 是类似的写法。
内积 ( ⟨ u , v ⟩ z = g ( z ) ( u , v ) \langle u, v \rangle_z = g(z)(u, v) ⟨u,v⟩z=g(z)(u,v) ) 的意义
Riemannian 度量 ( g ( z ) g(z) g(z) ) 的核心作用是定义切空间 ( T z M T_zM TzM ) 上的内积。内积是我们熟悉的概念(比如欧几里得空间中的点积),但在流形上,它由 ( g ( z ) g(z) g(z) ) 定制:
- ( ⟨ u , v ⟩ z = g ( z ) ( u , v ) \langle u, v \rangle_z = g(z)(u, v) ⟨u,v⟩z=g(z)(u,v)) 表示 ( u u u ) 和 ( v v v ) 在 ( z z z ) 点的内积。
- 这个内积可以用来计算角度、长度等几何量。比如:
- 向量 ( u u u ) 的长度:( ∥ u ∥ z = ⟨ u , u ⟩ z = g ( z ) ( u , u ) \|u\|_z = \sqrt{\langle u, u \rangle_z} = \sqrt{g(z)(u, u)} ∥u∥z=⟨u,u⟩z=g(z)(u,u) )。
- ( u u u ) 和 ( v v v ) 的夹角:( cos θ = ⟨ u , v ⟩ z ∥ u ∥ z ∥ v ∥ z \cos\theta = \frac{\langle u, v \rangle_z}{\|u\|_z \|v\|_z} cosθ=∥u∥z∥v∥z⟨u,v⟩z )。
在欧几里得空间中,内积是简单的 ( u ⋅ v = u T v u \cdot v = u^T v u⋅v=uTv ),但在流形上,( g ( z ) g(z) g(z) ) 会根据局部几何调整内积的计算方式。
用矩阵形式理解 ( g ( z ) g(z) g(z) )
文中提到,( g ( z ) g(z) g(z) ) 可以用矩阵 ( G ( z ) G(z) G(z) ) 表示:
⟨ u , v ⟩ z = g ( z ) ( u , v ) = u T G ( z ) v \langle u, v \rangle_z = g(z)(u, v) = u^T G(z) v ⟨u,v⟩z=g(z)(u,v)=uTG(z)v
- ( G ( z ) G(z) G(z) ) 是一个对称正定矩阵,大小是 ( T z M T_zM TzM ) 的维度(比如二维流形上是个 ( 2 × 2 2 \times 2 2×2 ) 矩阵)。
- ( u u u ) 和 ( v v v ) 是列向量,( u T G ( z ) v u^T G(z) v uTG(z)v ) 是矩阵运算,给出内积的具体值。
- ( G ( z ) G(z) G(z) ) 随 ( z z z ) 变化,反映了流形在不同点的“弯曲”特性。
例如:
- 在平面 ( R 2 \mathbb{R}^2 R2 ) 上,( G ( z ) = I G(z) = I G(z)=I )(单位矩阵),内积是 ( u T v u^T v uTv )。
- 在球面上,( G ( z ) G(z) G(z) ) 由球面坐标决定,可能包含 ( sin θ \sin\theta sinθ ) 等项。
一个直观的例子
假设你在地球表面(一个二维球面流形)上,点 ( z z z ) 是北极:
- ( T z M T_zM TzM ) 是北极的切平面,包含东西方向和南北方向的向量,比如 ( u = ( 1 , 0 ) u = (1, 0) u=(1,0))(向东),( v = ( 0 , 1 ) v = (0, 1) v=(0,1) )(向南)。
- ( g ( z ) g(z) g(z) ) 定义了这些方向的内积。假设 ( G ( z ) = I G(z) = I G(z)=I )(简化假设),那么 ( g ( z ) ( u , v ) = u T v = 0 g(z)(u, v) = u^T v = 0 g(z)(u,v)=uTv=0 ),说明东和南垂直。
- 如果你在赤道,( G ( z ) G(z) G(z) ) 可能会有不同的缩放因子,因为球面曲率影响了局部几何。
回答提出的问题
-
( T z M × T z M → R T_zM \times T_zM \to \mathbb{R} TzM×TzM→R ) 的“相乘”是什么意思?
- 这里的“( × \times × )”不是向量相乘,而是表示输入是两个切向量的组合(有序对)。( g ( z ) g(z) g(z) ) 接收这对向量,输出一个实数,不是 ( u u u ) 和 ( v v v ) 直接相乘。
-
( g ( z ) ( u , v ) g(z)(u, v) g(z)(u,v) ) 是 ( g ( z ) g(z) g(z) ) 作用于 ( u u u ) 和 ( v v v ) 吗?还是相乘?
- 是 ( g ( z ) g(z) g(z) ) 作用于 ( u u u ) 和 ( v v v )。具体来说,( g ( z ) g(z) g(z) ) 是一个函数,( ( u , v ) (u, v) (u,v) ) 是它的输入,( g ( z ) ( u , v ) g(z)(u, v) g(z)(u,v) ) 是输出结果(内积值)。它不是 ( g ( z ) g(z) g(z) ) 和 ( ( u , v ) (u, v) (u,v) ) 的乘法,而是 ( g ( z ) g(z) g(z) ) 对 ( u u u ) 和 ( v v v ) 的“测量”。
总结
- ( T z M × T z M → R T_zM \times T_zM \to \mathbb{R} TzM×TzM→R ) 描述了 ( g ( z ) g(z) g(z) ) 的定义域和值域:输入是两个切向量,输出是实数。
- ( g ( z ) ( u , v ) g(z)(u, v) g(z)(u,v) ) 是 ( g ( z ) g(z) g(z) ) 作用于 ( u u u ) 和 ( v v v ),计算它们在内积意义下的“关系”,用矩阵形式是 ( u T G ( z ) v u^T G(z) v uTG(z)v )。
例子展示 ( G ( z ) G(z) G(z) )的计算过程
下面会通过具体的例子来展示 ( G ( z ) G(z) G(z) )(Riemannian 度量的矩阵表示)的计算过程。我们会以两种常曲率流形为例:二维球面(正曲率)和 Poincaré 盘(负曲率)。这些例子会帮助你直观理解 ( G ( z ) G(z) G(z) ) 如何反映流形的几何特性,以及如何计算内积 ( g ( z ) ( u , v ) = u T G ( z ) v g(z)(u, v) = u^T G(z) v g(z)(u,v)=uTG(z)v )。
示例 1:二维球面(正曲率流形)
二维球面 ( S 2 S^2 S2 ) 是单位球面,定义为:
S 2 = { ( x , y , z ) ∈ R 3 ∣ x 2 + y 2 + z 2 = 1 } S^2 = \{ (x, y, z) \in \mathbb{R}^3 \mid x^2 + y^2 + z^2 = 1 \} S2={(x,y,z)∈R3∣x2+y2+z2=1}
它的维度是 2,因为表面是二维的。我们通常用球坐标 ( ( θ , ϕ ) (\theta, \phi) (θ,ϕ) ) 参数化:
- ( θ ∈ [ 0 , π ] \theta \in [0, \pi] θ∈[0,π] ):极角,从北极到南极。
- ( ϕ ∈ [ 0 , 2 π ) \phi \in [0, 2\pi) ϕ∈[0,2π) ):方位角,绕着 z 轴转。
- 坐标变换:
x = sin θ cos ϕ , y = sin θ sin ϕ , z = cos θ x = \sin\theta \cos\phi, \quad y = \sin\theta \sin\phi, \quad z = \cos\theta x=sinθcosϕ,y=sinθsinϕ,z=cosθ
切空间 ( T z S 2 T_z S^2 TzS2 )
假设点 ( z z z ) 在球面上,用球坐标表示为 ( z = ( θ 0 , ϕ 0 ) z = (\theta_0, \phi_0) z=(θ0,ϕ0) )。切空间 ( T z S 2 T_z S^2 TzS2 ) 是二维的,由两个基向量张成:
- ( e θ = ∂ ∂ θ e_\theta = \frac{\partial}{\partial \theta} eθ=∂θ∂ ):沿 ( θ \theta θ ) 方向的切向量。
- ( e ϕ = ∂ ∂ ϕ e_\phi = \frac{\partial}{\partial \phi} eϕ=∂ϕ∂ ):沿 ( ϕ \phi ϕ ) 方向的切向量。
计算这些基向量(在 ( R 3 \mathbb{R}^3 R3 ) 中的表示):
- ( ∂ ∂ θ ( x , y , z ) = ( cos θ cos ϕ , cos θ sin ϕ , − sin θ ) \frac{\partial}{\partial \theta} (x, y, z) = (\cos\theta \cos\phi, \cos\theta \sin\phi, -\sin\theta) ∂θ∂(x,y,z)=(cosθcosϕ,cosθsinϕ,−sinθ) )
- ( ∂ ∂ ϕ ( x , y , z ) = ( − sin θ sin ϕ , sin θ cos ϕ , 0 ) \frac{\partial}{\partial \phi} (x, y, z) = (-\sin\theta \sin\phi, \sin\theta \cos\phi, 0) ∂ϕ∂(x,y,z)=(−sinθsinϕ,sinθcosϕ,0) )
计算 ( G ( z ) G(z) G(z) )
球面的度量 ( g ( z ) g(z) g(z) ) 继承自 ( R 3 \mathbb{R}^3 R3 ) 的欧几里得度量,但限制在切空间上。度量张量的分量是基向量的内积:
- ( g θ θ = ⟨ e θ , e θ ⟩ = ( cos θ cos ϕ ) 2 + ( cos θ sin ϕ ) 2 + ( − sin θ ) 2 = cos 2 θ ( cos 2 ϕ + sin 2 ϕ ) + sin 2 θ = 1 g_{\theta\theta} = \langle e_\theta, e_\theta \rangle = (\cos\theta \cos\phi)^2 + (\cos\theta \sin\phi)^2 + (-\sin\theta)^2 = \cos^2\theta (\cos^2\phi + \sin^2\phi) + \sin^2\theta = 1 gθθ=⟨eθ,eθ⟩=(cosθcosϕ)2+(cosθsinϕ)2+(−sinθ)2=cos2θ(cos2ϕ+sin2ϕ)+sin2θ=1 )
- ( g ϕ ϕ = ⟨ e ϕ , e ϕ ⟩ = ( − sin θ sin ϕ ) 2 + ( sin θ cos ϕ ) 2 + 0 = sin 2 θ ( sin 2 ϕ + cos 2 ϕ ) = sin 2 θ g_{\phi\phi} = \langle e_\phi, e_\phi \rangle = (-\sin\theta \sin\phi)^2 + (\sin\theta \cos\phi)^2 + 0 = \sin^2\theta (\sin^2\phi + \cos^2\phi) = \sin^2\theta gϕϕ=⟨eϕ,eϕ⟩=(−sinθsinϕ)2+(sinθcosϕ)2+0=sin2θ(sin2ϕ+cos2ϕ)=sin2θ )
- ( g θ ϕ = ⟨ e θ , e ϕ ⟩ = ( − cos θ cos ϕ sin θ sin ϕ ) + ( cos θ sin ϕ sin θ cos ϕ ) + 0 = 0 g_{\theta\phi} = \langle e_\theta, e_\phi \rangle = (-\cos\theta \cos\phi \sin\theta \sin\phi) + (\cos\theta \sin\phi \sin\theta \cos\phi) + 0 = 0 gθϕ=⟨eθ,eϕ⟩=(−cosθcosϕsinθsinϕ)+(cosθsinϕsinθcosϕ)+0=0 )
所以,度量矩阵 ( G ( z ) G(z) G(z) ) 在 ( ( θ , ϕ ) (\theta, \phi) (θ,ϕ) ) 坐标下是:
G ( z ) = ( g θ θ g θ ϕ g ϕ θ g ϕ ϕ ) = ( 1 0 0 sin 2 θ ) G(z) = \begin{pmatrix} g_{\theta\theta} & g_{\theta\phi} \\ g_{\phi\theta} & g_{\phi\phi} \end{pmatrix} = \begin{pmatrix} 1 & 0 \\ 0 & \sin^2\theta \end{pmatrix} G(z)=(gθθgϕθgθϕgϕϕ)=(100sin2θ)
内积计算
假设有两个切向量 ( u = u θ e θ + u ϕ e ϕ u = u_\theta e_\theta + u_\phi e_\phi u=uθeθ+uϕeϕ ),( v = v θ e θ + v ϕ e ϕ v = v_\theta e_\theta + v_\phi e_\phi v=vθeθ+vϕeϕ ),用坐标表示为 ( u = ( u θ , u ϕ ) u = (u_\theta, u_\phi) u=(uθ,uϕ) ),( v = ( v θ , v ϕ ) v = (v_\theta, v_\phi) v=(vθ,vϕ) )。内积是:
g ( z ) ( u , v ) = u T G ( z ) v = ( u θ u ϕ ) ( 1 0 0 sin 2 θ ) ( v θ v ϕ ) = u θ v θ + sin 2 θ u ϕ v ϕ g(z)(u, v) = u^T G(z) v = \begin{pmatrix} u_\theta & u_\phi \end{pmatrix} \begin{pmatrix} 1 & 0 \\ 0 & \sin^2\theta \end{pmatrix} \begin{pmatrix} v_\theta \\ v_\phi \end{pmatrix} = u_\theta v_\theta + \sin^2\theta u_\phi v_\phi g(z)(u,v)=uTG(z)v=(uθuϕ)(100sin2θ)(vθvϕ)=uθvθ+sin2θuϕvϕ
例子
在赤道 ( θ = π 2 \theta = \frac{\pi}{2} θ=2π ):
- ( G ( z ) = ( 1 0 0 1 ) G(z) = \begin{pmatrix} 1 & 0 \\ 0 & 1 \end{pmatrix} G(z)=(1001) )(因为 ( sin 2 π 2 = 1 \sin^2\frac{\pi}{2} = 1 sin22π=1 ))。
- 若 ( u = ( 1 , 0 ) u = (1, 0) u=(1,0) ),( v = ( 0 , 1 ) v = (0, 1) v=(0,1) ),则 ( g ( z ) ( u , v ) = 1 ⋅ 0 + 1 ⋅ 0 = 0 g(z)(u, v) = 1 \cdot 0 + 1 \cdot 0 = 0 g(z)(u,v)=1⋅0+1⋅0=0 ),说明 ( θ \theta θ ) 和 ( ϕ \phi ϕ ) 方向正交。
- 若 ( u = ( 1 , 1 ) u = (1, 1) u=(1,1) ),则 ( ∥ u ∥ z = 1 ⋅ 1 + 1 ⋅ 1 = 2 \|u\|_z = \sqrt{1 \cdot 1 + 1 \cdot 1} = \sqrt{2} ∥u∥z=1⋅1+1⋅1=2 )。
在北极 ( θ = 0 \theta = 0 θ=0 ):
- ( G ( z ) = ( 1 0 0 0 ) G(z) = \begin{pmatrix} 1 & 0 \\ 0 & 0 \end{pmatrix} G(z)=(1000) )(因为 ( sin 2 0 = 0 \sin^2 0 = 0 sin20=0 )),( ϕ \phi ϕ ) 方向的长度被压缩为 0,符合北极的几何。
示例 2:Poincaré 盘(负曲率流形)
Poincaré 盘是二维双曲空间,定义为单位圆盘:
B 2 = { ( x , y ) ∈ R 2 ∣ x 2 + y 2 < 1 } B^2 = \{ (x, y) \in \mathbb{R}^2 \mid x^2 + y^2 < 1 \} B2={(x,y)∈R2∣x2+y2<1}
配上度量:
d s 2 = 4 ( d x 2 + d y 2 ) ( 1 − x 2 − y 2 ) 2 ds^2 = \frac{4 (dx^2 + dy^2)}{(1 - x^2 - y^2)^2} ds2=(1−x2−y2)24(dx2+dy2)
切空间 ( T z B 2 T_z B^2 TzB2 )
在点 ( z = ( x , y ) z = (x, y) z=(x,y) ),切空间 ( T z B 2 T_z B^2 TzB2 ) 是二维的,用直角坐标基向量 ( e x = ( 1 , 0 ) e_x = (1, 0) ex=(1,0) )、( e y = ( 0 , 1 ) e_y = (0, 1) ey=(0,1) ) 表示。
计算 ( G ( z ) G(z) G(z) )
度量的线元素 ( d s 2 ds^2 ds2 ) 表明:
- ( g x x = 4 ( 1 − x 2 − y 2 ) 2 g_{xx} = \frac{4}{(1 - x^2 - y^2)^2} gxx=(1−x2−y2)24 )
- ( g y y = 4 ( 1 − x 2 − y 2 ) 2 g_{yy} = \frac{4}{(1 - x^2 - y^2)^2} gyy=(1−x2−y2)24 )
- ( g x y = 0 g_{xy} = 0 gxy=0 )(因为没有交叉项)
所以:
G ( z ) = 4 ( 1 − x 2 − y 2 ) 2 ( 1 0 0 1 ) = ( 4 ( 1 − r 2 ) 2 0 0 4 ( 1 − r 2 ) 2 ) G(z) = \frac{4}{(1 - x^2 - y^2)^2} \begin{pmatrix} 1 & 0 \\ 0 & 1 \end{pmatrix} = \begin{pmatrix} \frac{4}{(1 - r^2)^2} & 0 \\ 0 & \frac{4}{(1 - r^2)^2} \end{pmatrix} G(z)=(1−x2−y2)24(1001)=((1−r2)2400(1−r2)24)
其中 ( r 2 = x 2 + y 2 r^2 = x^2 + y^2 r2=x2+y2 )。
内积计算
对于 ( u = ( u x , u y ) u = (u_x, u_y) u=(ux,uy) ),( v = ( v x , v y ) v = (v_x, v_y) v=(vx,vy)):
g ( z ) ( u , v ) = u T G ( z ) v = 4 ( 1 − r 2 ) 2 ( u x v x + u y v y ) g(z)(u, v) = u^T G(z) v = \frac{4}{(1 - r^2)^2} (u_x v_x + u_y v_y) g(z)(u,v)=uTG(z)v=(1−r2)24(uxvx+uyvy)
例子
在原点 ( z = ( 0 , 0 ) z = (0, 0) z=(0,0) ):
- ( r = 0 r = 0 r=0 ),( G ( z ) = 4 ( 1 0 0 1 ) G(z) = 4 \begin{pmatrix} 1 & 0 \\ 0 & 1 \end{pmatrix} G(z)=4(1001) )。
- 若 ( u = ( 1 , 0 ) u = (1, 0) u=(1,0) ),( v = ( 0 , 1 ) v = (0, 1) v=(0,1) ),则 ( g ( z ) ( u , v ) = 4 ( 1 ⋅ 0 + 0 ⋅ 1 ) = 0 g(z)(u, v) = 4 (1 \cdot 0 + 0 \cdot 1) = 0 g(z)(u,v)=4(1⋅0+0⋅1)=0 )。
- 若 ( u = ( 1 , 0 ) u = (1, 0) u=(1,0) ),则 ( ∥ u ∥ z = 4 ⋅ 1 = 2 \|u\|_z = \sqrt{4 \cdot 1} = 2 ∥u∥z=4⋅1=2 )。
靠近边界 ( z = ( 0.9 , 0 ) z = (0.9, 0) z=(0.9,0) ):
- ( r = 0.9 r = 0.9 r=0.9 ),( 1 − r 2 = 0.19 1 - r^2 = 0.19 1−r2=0.19 ),( G ( z ) = 4 0.1 9 2 ( 1 0 0 1 ) ≈ 110.8 ( 1 0 0 1 ) G(z) = \frac{4}{0.19^2} \begin{pmatrix} 1 & 0 \\ 0 & 1 \end{pmatrix} \approx 110.8 \begin{pmatrix} 1 & 0 \\ 0 & 1 \end{pmatrix} G(z)=0.1924(1001)≈110.8(1001) )。
- 若 ( u = ( 1 , 0 ) u = (1, 0) u=(1,0) ),则 ( ∥ u ∥ z = 110.8 ≈ 10.5 \|u\|_z = \sqrt{110.8} \approx 10.5 ∥u∥z=110.8≈10.5 ),长度被放大,符合双曲几何。
总结
- 球面:( G ( z ) = ( 1 0 0 sin 2 θ ) G(z) = \begin{pmatrix} 1 & 0 \\ 0 & \sin^2\theta \end{pmatrix} G(z)=(100sin2θ) ),反映了球面在极点和赤道的几何变化。
- Poincaré 盘:( G ( z ) = 4 ( 1 − r 2 ) 2 I G(z) = \frac{4}{(1 - r^2)^2} I G(z)=(1−r2)24I ),靠近边界时度量放大,体现负曲率。
( G ( z ) G(z) G(z) ) 的计算依赖于流形的参数化和度量定义,直接决定了内积和距离的性质。希望这些例子让你对 ( g ( z ) g(z) g(z) ) 和 ( G ( z ) G(z) G(z) ) 的作用更清晰!
勒贝格测度(Lebesgue measure)
以下详细介绍勒贝格测度(Lebesgue measure)的概念,面向对数学和深度学习有一定基础的读者。会从直观理解出发,逐步深入到数学定义和公式,并联系到 Riemannian 流形中的应用场景(比如 ( d V o l ( z ) = ∣ G ( z ) ∣ d L e b ( z ) dVol(z) = \sqrt{|G(z)|} dLeb(z) dVol(z)=∣G(z)∣dLeb(z) )),让你明白它在度量和积分中的作用。
什么是勒贝格测度?从长度到体积的数学尺子
在 Riemannian 几何中,我们提到流形的度量 ( g ( z ) g(z) g(z) ) 诱导了一个测度 ( d V o l ( z ) = ∣ G ( z ) ∣ d L e b ( z ) dVol(z) = \sqrt{|G(z)|} dLeb(z) dVol(z)=∣G(z)∣dLeb(z) ),其中 ( d L e b ( z ) dLeb(z) dLeb(z) ) 是“勒贝格测度”。如果你听到这个名字觉得有点陌生,别慌!今天我们就来聊聊勒贝格测度是什么,它怎么工作,以及为什么它在流形和概率建模中这么重要。准备好进入数学的奇妙世界了吗?
测度:给集合“量尺寸”的工具
在数学中,测度(measure)是一个函数,用来给集合分配一个“大小”——可以是长度、面积、体积,甚至更高维的“量”。比如:
- 一条线段的长度是 2。
- 一个矩形的面积是 3 × 4 = 12。
- 一个球的体积是 ( 4 3 π r 3 \frac{4}{3} \pi r^3 34πr3 )。
但这些简单的例子都假设空间是规则的、直观的。如果空间是弯曲的(比如球面),或者集合很复杂(比如分形),我们需要更强大的工具。这时候,勒贝格测度就登场了。
从 Riemann 积分到勒贝格积分
我们先从积分说起,因为勒贝格测度的诞生和积分密切相关。你可能学过 Riemann 积分(黎曼积分),它把一个函数的积分想象成“把区间分成小块,计算每块的高度,再求和”。比如计算 ( f ( x ) = x 2 f(x) = x^2 f(x)=x2 ) 在 ( [ 0 , 1 ] [0, 1] [0,1] ) 上的积分:
- 把 ( [ 0 , 1 ] [0, 1] [0,1] ) 分成 ( n n n ) 个小区间,每块宽度 ( Δ x = 1 n \Delta x = \frac{1}{n} Δx=n1 )。
- 每块的高度近似取 ( f ( x i ) f(x_i) f(xi) ),面积和是 ( ∑ f ( x i ) Δ x \sum f(x_i) \Delta x ∑f(xi)Δx )。
- 当 ( n → ∞ n \to \infty n→∞ ) 时,得到精确值 ( ∫ 0 1 x 2 d x = 1 3 \int_0^1 x^2 \, dx = \frac{1}{3} ∫01x2dx=31 )。
Riemann 积分简单直观,但有个问题:它要求函数“足够连续”,而且只能处理规则的区间。如果函数跳跃得很厉害,或者我们想积分的区域很奇怪(比如 Cantor 集),Riemann 积分就力不从心了。
勒贝格积分(Lebesgue 积分)换了个思路:不是按 ( x x x ) 轴分割区间,而是按函数值的高度分割,然后测量每个高度对应的“区域大小”。这需要一个新的测度工具——勒贝格测度。
勒贝格测度的直观定义
勒贝格测度 ( dLeb ) 是欧几里得空间 ( R n \mathbb{R}^n Rn ) 上的一种“标准测度”,用来量化集合的“大小”:
- 在 ( R \mathbb{R} R )(一维)上,它测量线段的长度。
- 在 ( R 2 \mathbb{R}^2 R2 )(二维)上,它测量矩形或圆的面积。
- 在 ( R 3 \mathbb{R}^3 R3 )(三维)上,它测量立方体或球的体积。
它的核心思想是用外测度(outer measure)逼近任何集合的大小,即使集合很复杂。具体来说:
- 用简单的矩形(或立方体)覆盖你要测量的集合。
- 计算这些矩形的总大小。
- 取所有可能覆盖的最小值,作为集合的测度。
数学定义
在 ( R n \mathbb{R}^n Rn ) 上,勒贝格测度的正式定义基于可测集合(measurable sets)。先定义基本集合的测度:
- 对于一个 ( n n n ) 维矩形 ( I = [ a 1 , b 1 ] × [ a 2 , b 2 ] × ⋯ × [ a n , b n ] I = [a_1, b_1] \times [a_2, b_2] \times \cdots \times [a_n, b_n] I=[a1,b1]×[a2,b2]×⋯×[an,bn] ):
μ ( I ) = ( b 1 − a 1 ) ⋅ ( b 2 − a 2 ) ⋅ … ⋅ ( b n − a n ) \mu(I) = (b_1 - a_1) \cdot (b_2 - a_2) \cdot \ldots \cdot (b_n - a_n) μ(I)=(b1−a1)⋅(b2−a2)⋅…⋅(bn−an)
这是矩形的“体积”。
然后,对于任意集合 ( A ⊂ R n A \subset \mathbb{R}^n A⊂Rn ):
- 外测度:
μ ∗ ( A ) = inf { ∑ i = 1 ∞ μ ( I i ) ∣ A ⊂ ⋃ i = 1 ∞ I i , I i 是矩形 } \mu^*(A) = \inf \left\{ \sum_{i=1}^\infty \mu(I_i) \mid A \subset \bigcup_{i=1}^\infty I_i, I_i \text{ 是矩形} \right\} μ∗(A)=inf{ i=1∑∞μ(Ii)∣A⊂i=1⋃∞Ii,Ii 是矩形}
意思是用无数个矩形覆盖 ( A A A ),取所有覆盖体积和的最小值。 - ( A A A ) 是勒贝格可测的,如果它满足 Carathéodory 准则(简单说,就是分割集合时测度加起来一致)。
- 如果 ( A A A ) 可测,则勒贝格测度 ( μ ( A ) = μ ∗ ( A ) \mu(A) = \mu^*(A) μ(A)=μ∗(A) )。
在微分形式下,勒贝格测度记作 ( d L e b ( x ) dLeb(x) dLeb(x) ) 或 ( d x dx dx )(一维时),表示“无穷小的标准测度元素”。
例子
-
一维:
- 区间 ( [ 0 , 1 ] [0, 1] [0,1]) 的勒贝格测度是 ( μ ( [ 0 , 1 ] ) = 1 − 0 = 1 \mu([0, 1]) = 1 - 0 = 1 μ([0,1])=1−0=1 )。
- 单点 ( { 0 } \{0\} { 0} ) 的测度是 0(因为没有长度)。
- 有理数集 ( Q ∩ [ 0 , 1 ] \mathbb{Q} \cap [0, 1] Q∩[0,1] ) 的测度是 0(虽然点无穷多,但它们“稀疏”,可以用很小的矩形覆盖,总长度趋于 0)。
-
二维:
- 单位正方形 ( [ 0 , 1 ] × [ 0 , 1 ] [0, 1] \times [0, 1] [0,1]×[0,1] ) 的测度是 ( 1 × 1 = 1 1 \times 1 = 1 1×1=1 )。
- 单位圆盘 ( { ( x , y ) ∣ x 2 + y 2 ≤ 1 } \{ (x, y) \mid x^2 + y^2 \leq 1 \} {(x,y)∣x2+y2≤1} ) 的测度是 ( π \pi π )。
在 Riemannian 流形中的角色
回到 Riemannian 流形 ( ( M , g ) (M, g) (M,g) )。在欧几里得空间 ( R n \mathbb{R}^n Rn ) 上,勒贝格测度 ( d L e b ( z ) dLeb(z) dLeb(z) ) 是默认的“平坦”测度。但流形可能是弯曲的,度量 ( g ( z ) g(z) g(z) )(矩阵形式 ( G ( z ) G(z) G(z) ))会扭曲空间的几何。这时,流形上的体积元素需要调整:
d V o l ( z ) = ∣ G ( z ) ∣ d L e b ( z ) dVol(z) = \sqrt{|G(z)|} dLeb(z) dVol(z)=∣G(z)∣dLeb(z)
- ( G ( z ) G(z) G(z) ) 是度量张量的矩阵表示,( ∣ G ( z ) ∣ |G(z)| ∣G(z)∣ ) 是它的行列式。
- ( ∣ G ( z ) ∣ \sqrt{|G(z)|} ∣G(z)∣ ) 是“缩放因子”,反映局部几何对标准测度的调整。
举例:二维球面
在单位球面 ( S 2 S^2 S2 ) 上,用球坐标 ( ( θ , ϕ ) (\theta, \phi) (θ,ϕ)):
- ( G ( z ) = ( 1 0 0 sin 2 θ ) G(z) = \begin{pmatrix} 1 & 0 \\ 0 & \sin^2\theta \end{pmatrix} G(z)=(100sin2θ) )(见之前的例子)。
- ( ∣ G ( z ) ∣ = 1 ⋅ sin 2 θ = sin 2 θ |G(z)| = 1 \cdot \sin^2\theta = \sin^2\theta ∣G(z)∣=1⋅sin2θ=sin2θ )。
- 体积元素:
d V o l ( z ) = sin 2 θ d L e b ( θ , ϕ ) = sin θ d θ d ϕ dVol(z) = \sqrt{\sin^2\theta} dLeb(\theta, \phi) = \sin\theta \, d\theta d\phi dVol(z)=sin2θdLeb(θ,ϕ)=sinθdθdϕ
(这里 ( d L e b ( θ , ϕ ) = d θ d ϕ dLeb(\theta, \phi) = d\theta d\phi dLeb(θ,ϕ)=dθdϕ ) 是 ( R 2 \mathbb{R}^2 R2 ) 上的勒贝格测度,( sin θ \sin\theta sinθ ) 是球面几何的调整因子。) - 整个球面的面积:
∫ S 2 d V o l = ∫ 0 2 π ∫ 0 π sin θ d θ d ϕ = 2 π ⋅ 2 = 4 π \int_{S^2} dVol = \int_0^{2\pi} \int_0^\pi \sin\theta \, d\theta d\phi = 2\pi \cdot 2 = 4\pi ∫S2dVol=∫02π∫0πsinθdθdϕ=2π⋅2=4π
符合单位球面的面积。
举例:Poincaré 盘
在单位盘 ( B 2 B^2 B2 ) 上,( G ( z ) = 4 ( 1 − r 2 ) 2 I G(z) = \frac{4}{(1 - r^2)^2} I G(z)=(1−r2)24I ):
- ( ∣ G ( z ) ∣ = ( 4 ( 1 − r 2 ) 2 ) 2 = 16 ( 1 − r 2 ) 4 |G(z)| = \left( \frac{4}{(1 - r^2)^2} \right)^2 = \frac{16}{(1 - r^2)^4} ∣G(z)∣=((1−r2)24)2=(1−r2)416 )。
- 体积元素:
d V o l ( z ) = 16 ( 1 − r 2 ) 4 d L e b ( x , y ) = 4 ( 1 − r 2 ) 2 d x d y dVol(z) = \sqrt{\frac{16}{(1 - r^2)^4}} dLeb(x, y) = \frac{4}{(1 - r^2)^2} dx dy dVol(z)=(1−r2)416dLeb(x,y)=(1−r2)24dxdy
靠近边界 ( r → 1 r \to 1 r→1 ) 时,( d V o l dVol dVol ) 变得很大,反映双曲空间的“扩张”特性。
为什么用勒贝格测度?
- 普适性:勒贝格测度是 ( R n \mathbb{R}^n Rn ) 上的标准测度,自然延伸到流形上的局部坐标。
- 积分能力:它支持勒贝格积分,能处理复杂的集合和函数,在概率密度估计(如 normalizing flows)中至关重要。
- 几何调整:结合 ( ∣ G ( z ) ∣ \sqrt{|G(z)|} ∣G(z)∣ ),它适配了流形的弯曲特性。
总结
勒贝格测度 ( d L e b ( z ) dLeb(z) dLeb(z) ) 是欧几里得空间的标准“尺子”,测量集合的大小。在 Riemannian 流形中,它被度量 ( G ( z ) G(z) G(z) ) 调整为 ( d V o l ( z ) dVol(z) dVol(z) ),成为计算体积、定义概率分布的基础。无论是球面的 ( sin θ \sin\theta sinθ ),还是双曲盘的 ( 4 ( 1 − r 2 ) 2 \frac{4}{(1 - r^2)^2} (1−r2)24 ),勒贝格测度都默默地扮演着“基底”的角色。
详细解释测地线
想深入了解测地线(geodesic)的计算,我们来详细探讨一下 Riemannian 流形上的测地线是什么,如何计算,以及具体的例子。会从概念入手,推导数学公式,并以二维球面和 Poincaré 盘为例,展示测地线的计算过程。这会帮助你理解文中提到的“测地线是流形上两点间的最短路径”以及指数映射的意义。
测地线:流形上的“直线”
在 Riemannian 几何中,测地线是流形上两点间的最短路径,类似于欧几里得空间中的直线。但因为流形可能是弯曲的,测地线的计算需要考虑度量 ( g ( z ) g(z) g(z) ) 的影响。测地线不仅在几何中有重要意义,在 normalizing flows(如 RCNFs)中也用来定义粒子沿流形的“自然移动”路径。
测地线的定义
测地线 ( γ ( t ) \gamma(t) γ(t) ) 是一条曲线,满足:
- 最短路径:对于两点 ( z , y ∈ M z, y \in M z,y∈M ),( γ ( 0 ) = z \gamma(0) = z γ(0)=z ),( γ ( 1 ) = y \gamma(1) = y γ(1)=y ),其长度 ( L ( γ ) = ∫ 0 1 ∥ γ ′ ( t ) ∥ γ ( t ) d t L(\gamma) = \int_0^1 \|\gamma'(t)\|_{\gamma(t)} \, dt L(γ)=∫01∥γ′(t)∥γ(t)dt ) 是所有连接 ( z z z ) 和 ( y y y ) 的曲线中最小的。
- 常速:通常要求 ( ∥ γ ′ ( t ) ∥ γ ( t ) = 常数 \|\gamma'(t)\|_{\gamma(t)} = \text{常数} ∥γ′(t)∥γ(t)=常数 ),即速度在流形上均匀。
- 局部直:测地线是“局部最直”的曲线,满足一个微分方程(测地线方程)。
长度定义为:
L ( γ ) = ∫ 0 1 g ( γ ( t ) ) ( γ ′ ( t ) , γ ′ ( t ) ) d t L(\gamma) = \int_0^1 \sqrt{g(\gamma(t))(\gamma'(t), \gamma'(t))} \, dt L(γ)=∫01g(γ(t))(γ′(t),γ′(t))dt
其中 ( γ ′ ( t ) = d γ d t \gamma'(t) = \frac{d\gamma}{dt} γ′(t)=dtdγ ) 是切向量,( g g g ) 是度量。
测地线方程
测地线的数学描述来自变分法:它是最短路径的极值曲线。推导后,测地线满足以下二阶微分方程(测地线方程):
d 2 γ k d t 2 + ∑ i , j Γ i j k d γ i d t d γ j d t = 0 , k = 1 , … , n \frac{d^2 \gamma^k}{dt^2} + \sum_{i,j} \Gamma^k_{ij} \frac{d\gamma^i}{dt} \frac{d\gamma^j}{dt} = 0, \quad k = 1, \dots, n dt2d2γk+i,j∑Γijkdtdγidtdγj=0,k=1,…,n
- ( γ ( t ) = ( γ 1 ( t ) , … , γ n ( t ) ) \gamma(t) = (\gamma^1(t), \dots, \gamma^n(t)) γ(t)=(γ1(t),…,γn(t)) ) 是局部坐标中的曲线。
- ( Γ i j k \Gamma^k_{ij} Γijk ) 是 Christoffel 符号(连接系数),由度量 ( g i j g_{ij} gij ) 计算:
Γ i j k = 1 2 ∑ m g k m ( ∂ g m j ∂ x i + ∂ g m i ∂ x j − ∂ g i j ∂ x m ) \Gamma^k_{ij} = \frac{1}{2} \sum_m g^{km} \left( \frac{\partial g_{mj}}{\partial x^i} + \frac{\partial g_{mi}}{\partial x^j} - \frac{\partial g_{ij}}{\partial x^m} \right) Γijk=21m∑gkm(∂xi∂gmj+∂xj∂gmi−∂xm∂gij)
其中 ( g k m g^{km} gkm ) 是度量矩阵 ( G ( z ) G(z) G(z) ) 的逆矩阵 ( G − 1 ( z ) G^{-1}(z) G−1(z) ) 的元素。
这个方程看起来复杂,但它描述了测地线如何“适应”流形的曲率。
示例 1:二维球面 ( S 2 S^2 S2 ) 的测地线
单位球面 ( S 2 = { ( x , y , z ) ∣ x 2 + y 2 + z 2 = 1 } S^2 = \{ (x, y, z) \mid x^2 + y^2 + z^2 = 1 \} S2={(x,y,z)∣x2+y2+z2=1} ),用球坐标 ( ( θ , ϕ ) (\theta, \phi) (θ,ϕ) ):
- 度量:( G ( z ) = ( 1 0 0 sin 2 θ ) G(z) = \begin{pmatrix} 1 & 0 \\ 0 & \sin^2\theta \end{pmatrix} G(z)=(100sin2θ) )。
计算 Christoffel 符号
设坐标 ( x 1 = θ x^1 = \theta x1=θ ),( x 2 = ϕ x^2 = \phi x2=ϕ ),度量分量 ( g 11 = 1 g_{11} = 1 g11=1 ),( g 22 = sin 2 θ g_{22} = \sin^2\theta g22=sin2θ ),( g 12 = g 21 = 0 g_{12} = g_{21} = 0 g12=g21=0 )。逆矩阵 ( g 11 = 1 g^{11} = 1 g11=1 ),( g 22 = 1 sin 2 θ g^{22} = \frac{1}{\sin^2\theta} g22=sin2θ1 ),( g 12 = 0 g^{12} = 0 g12=0 )。
计算非零的 Christoffel 符号:
- ( Γ i j 1 \Gamma^1_{ij} Γij1 ):
- ( Γ 11 1 = 1 2 g 11 ( ∂ g 11 ∂ θ + ∂ g 11 ∂ θ − ∂ g 11 ∂ θ ) = 0 \Gamma^1_{11} = \frac{1}{2} g^{11} \left( \frac{\partial g_{11}}{\partial \theta} + \frac{\partial g_{11}}{\partial \theta} - \frac{\partial g_{11}}{\partial \theta} \right) = 0 Γ111=21g11(∂θ∂g11+∂θ∂g11−∂θ∂g11)=0 )(因为 ( g 11 = 1 g_{11} = 1 g11=1 ) 是常数)。
- ( Γ 22 1 = 1 2 g 11 ( ∂ g 22 ∂ θ ) = 1 2 ⋅ 1 ⋅ ∂ sin 2 θ ∂ θ = sin θ cos θ \Gamma^1_{22} = \frac{1}{2} g^{11} \left( \frac{\partial g_{22}}{\partial \theta} \right) = \frac{1}{2} \cdot 1 \cdot \frac{\partial \sin^2\theta}{\partial \theta} = \sin\theta \cos\theta Γ221=21g11(∂θ∂g22)=21⋅1⋅∂θ∂sin2θ=sinθcosθ )。
- ( Γ i j 2 \Gamma^2_{ij} Γij2 ):
- ( Γ 12 2 = Γ 21 2 = 1 2 g 22 ( ∂ g 22 ∂ θ ) = 1 2 ⋅ 1 sin 2 θ ⋅ 2 sin θ cos θ = cos θ sin θ \Gamma^2_{12} = \Gamma^2_{21} = \frac{1}{2} g^{22} \left( \frac{\partial g_{22}}{\partial \theta} \right) = \frac{1}{2} \cdot \frac{1}{\sin^2\theta} \cdot 2 \sin\theta \cos\theta = \frac{\cos\theta}{\sin\theta} Γ122=Γ212=21g22(∂θ∂g22)=21⋅sin2θ1⋅2sinθcosθ=sinθcosθ ).
其他项为 0。
测地线方程
d 2 θ d t 2 + Γ 22 1 ( d ϕ d t ) 2 = 0 ⇒ d 2 θ d t 2 + sin θ cos θ ( d ϕ d t ) 2 = 0 \frac{d^2\theta}{dt^2} + \Gamma^1_{22} \left( \frac{d\phi}{dt} \right)^2 = 0 \quad \Rightarrow \quad \frac{d^2\theta}{dt^2} + \sin\theta \cos\theta \left( \frac{d\phi}{dt} \right)^2 = 0 dt2d2θ+Γ221(dtdϕ)2=0⇒dt2d2θ+sinθcosθ(dtdϕ)2=0
d 2 ϕ d t 2 + 2 Γ 12 2 d θ d t d ϕ d t = 0 ⇒ d 2 ϕ d t 2 + 2 cos θ sin θ d θ d t d ϕ d t = 0 \frac{d^2\phi}{dt^2} + 2 \Gamma^2_{12} \frac{d\theta}{dt} \frac{d\phi}{dt} = 0 \quad \Rightarrow \quad \frac{d^2\phi}{dt^2} + 2 \frac{\cos\theta}{\sin\theta} \frac{d\theta}{dt} \frac{d\phi}{dt} = 0 dt2d2ϕ+2Γ122dtdθdtdϕ=0⇒dt2d2ϕ+2sinθcosθdtdθdtdϕ=0
解:大圆
假设 ( θ = π 2 \theta = \frac{\pi}{2} θ=2π )(赤道平面),则:
- 第一方程:( d 2 θ d t 2 = 0 \frac{d^2\theta}{dt^2} = 0 dt2d2θ=0 ),( θ = π 2 \theta = \frac{\pi}{2} θ=2π ) 是解。
- 第二方程:( d 2 ϕ d t 2 = 0 \frac{d^2\phi}{dt^2} = 0 dt2d2ϕ=0 )(因为 ( cos π 2 = 0 \cos\frac{\pi}{2} = 0 cos2π=0 )),( ϕ = a t + b \phi = at + b ϕ=at+b )。
在 ( R 3 \mathbb{R}^3 R3 ) 中,( θ = π 2 \theta = \frac{\pi}{2} θ=2π ) 对应 ( z = 0 z = 0 z=0 ),( x = cos ( a t + b ) x = \cos(at + b) x=cos(at+b) ),( y = sin ( a t + b ) y = \sin(at + b) y=sin(at+b) ),这是一个大圆(赤道)。一般情况下,球面上的测地线都是大圆,连接两点的最短路径。
示例 2:Poincaré 盘 ( B 2 B^2 B2 ) 的测地线
单位盘 ( B 2 = { ( x , y ) ∣ x 2 + y 2 < 1 B^2 = \{ (x, y) \mid x^2 + y^2 < 1 B2={(x,y)∣x2+y2<1 } ),度量:
G ( z ) = 4 ( 1 − x 2 − y 2 ) 2 ( 1 0 0 1 ) G(z) = \frac{4}{(1 - x^2 - y^2)^2} \begin{pmatrix} 1 & 0 \\ 0 & 1 \end{pmatrix} G(z)=(1−x2−y2)24(1001)
设 ( λ = 2 1 − x 2 − y 2 \lambda = \frac{2}{1 - x^2 - y^2} λ=1−x2−y22 ),则 ( g 11 = g 22 = λ 2 g_{11} = g_{22} = \lambda^2 g11=g22=λ2 ),( g 12 = 0 g_{12} = 0 g12=0 )。
计算 Christoffel 符号
- ( ∂ g 11 ∂ x = ∂ ∂ x ( 4 ( 1 − x 2 − y 2 ) 2 ) = 8 2 x ( 1 − x 2 − y 2 ) 3 = 16 x ( 1 − r 2 ) 3 \frac{\partial g_{11}}{\partial x} = \frac{\partial}{\partial x} \left( \frac{4}{(1 - x^2 - y^2)^2} \right) = 8 \frac{2x}{(1 - x^2 - y^2)^3} = \frac{16x}{(1 - r^2)^3} ∂x∂g11=∂x∂((1−x2−y2)24)=8(1−x2−y2)32x=(1−r2)316x )(( r 2 = x 2 + y 2 r^2 = x^2 + y^2 r2=x2+y2 ))。
- ( ∂ g 11 ∂ y = 16 y ( 1 − r 2 ) 3 \frac{\partial g_{11}}{\partial y} = \frac{16y}{(1 - r^2)^3} ∂y∂g11=(1−r2)316y )。
- ( g 11 = g 22 = ( 1 − r 2 ) 2 4 g^{11} = g^{22} = \frac{(1 - r^2)^2}{4} g11=g22=4(1−r2)2 )。
计算:
- ( Γ 11 1 = 1 2 g 11 ( 2 ∂ g 11 ∂ x ) = 1 2 ⋅ ( 1 − r 2 ) 2 4 ⋅ 32 x ( 1 − r 2 ) 3 = 4 x 1 − r 2 \Gamma^1_{11} = \frac{1}{2} g^{11} \left( 2 \frac{\partial g_{11}}{\partial x} \right) = \frac{1}{2} \cdot \frac{(1 - r^2)^2}{4} \cdot \frac{32x}{(1 - r^2)^3} = \frac{4x}{1 - r^2} Γ111=21g11(2∂x∂g11)=21⋅4(1−r2)2⋅(1−r2)332x=1−r24x )。
- ( Γ 12 1 = 4 y 1 − r 2 \Gamma^1_{12} = \frac{4y}{1 - r^2} Γ121=1−r24y ),( Γ 22 2 = 4 y 1 − r 2 \Gamma^2_{22} = \frac{4y}{1 - r^2} Γ222=1−r24y )。
测地线方程
d 2 x d t 2 + 4 x 1 − r 2 ( d x d t ) 2 + 4 y 1 − r 2 d x d t d y d t = 0 \frac{d^2 x}{dt^2} + \frac{4x}{1 - r^2} \left( \frac{dx}{dt} \right)^2 + \frac{4y}{1 - r^2} \frac{dx}{dt} \frac{dy}{dt} = 0 dt2d2x+1−r24x(dtdx)2+1−r24ydtdxdtdy=0
d 2 y d t 2 + 4 x 1 − r 2 d x d t d y d t + 4 y 1 − r 2 ( d y d t ) 2 = 0 \frac{d^2 y}{dt^2} + \frac{4x}{1 - r^2} \frac{dx}{dt} \frac{dy}{dt} + \frac{4y}{1 - r^2} \left( \frac{dy}{dt} \right)^2 = 0 dt2d2y+1−r24xdtdxdtdy+1−r24y(dtdy)2=0
解:圆弧
假设沿 ( x x x ) 轴运动,( y = 0 y = 0 y=0 ):
- 第二方程满足,( d 2 y d t 2 = 0 \frac{d^2 y}{dt^2} = 0 dt2d2y=0 )。
- 第一方程:( d 2 x d t 2 + 4 x 1 − x 2 ( d x d t ) 2 = 0 \frac{d^2 x}{dt^2} + \frac{4x}{1 - x^2} \left( \frac{dx}{dt} \right)^2 = 0 dt2d2x+1−x24x(dtdx)2=0 )。
这是一个非线性方程,解表明测地线是直线(在 Poincaré 盘中看起来是直线,但实际是圆弧)。一般解涉及双曲几何,测地线是圆盘内与边界正交的圆弧。
总结
- 球面:测地线是大圆,由 ( θ \theta θ ) 和 ( ϕ \phi ϕ ) 的方程解出。
- Poincaré 盘:测地线是圆弧,反映双曲几何的负曲率。
- 计算关键:Christoffel 符号和二阶微分方程。
后记
2025年4月9日22点44分于上海,在grok 3大模型辅助下完成。