写给计算机系同学的李群与李代数（六）：李群与李代数在计算机中的应用

李群与李代数在计算机中的应用

在前五篇文章中，我们从李群（Lie Group）和李代数（Lie Algebra）的基本概念出发，逐步探索了矩阵指数映射（Matrix Exponential）、李括号（Lie Bracket）、结构常数（Structure Constants），以及最大阿贝尔子代数（Maximal Abelian Subalgebra, MASA）。这些数学工具看似抽象，却在计算机科学中有着广泛而深刻的应用。今天，我们将聚焦于李群与李代数如何解决实际问题，涵盖计算机图形学（Computer Graphics）、机器人学（Robotics）和机器学习（Machine Learning）。通过公式推导、具体例子和直观解释，我们将展示这些理论如何转化为高效的算法和优雅的解决方案。

李群与李代数的核心优势

为什么李群和李代数在计算机科学中如此重要？它们提供了描述连续变换（Continuous Transformation）的自然框架，具有以下优势：

几何约束：李群（如 SO(3)、SE(3)）天然保持变换的性质，例如旋转的正交性或刚体运动的结构。
局部线性化：李代数提供了一个线性空间，简化了非线性优化问题。
非交换性：李括号捕捉了变换的顺序依赖，适用于复杂运动的建模。

让我们通过三个领域——计算机图形学、机器人学和机器学习——具体探讨这些应用。

应用一：计算机图形学中的旋转与插值

在 3D 动画和游戏开发中，物体的旋转是核心任务。特殊正交群（Special Orthogonal Group, SO(3)）描述三维旋转，其李代数 $\text{so}(3)$ 由反对称矩阵（Skew-Symmetric Matrix）组成。

平滑旋转插值

假设我们需要让一个物体从旋转矩阵 $R_1 \in \text{SO}(3)$ 平滑过渡到 $R_2 \in \text{SO}(3)$ ，时间从 $t = 0$ 到 $t = 1$ 。直接在矩阵空间插值（例如 $1-t)R_1 + t R_2$ ）会破坏正交性，导致非旋转矩阵。使用李代数可以优雅地解决这个问题。

推导

计算相对旋转：
$R = R_1^T R_2$
$\in \text{SO}(3)$ 表示从 $R_1$ 到 $R_2$ 的旋转。
映射到 $\text{so}(3)$ ：
使用矩阵对数（Matrix Logarithm），近似为：
$\log R \in \text{so}(3)$
$B$ 是反对称矩阵，表示旋转轴和角度。例如，若 $R = e^B$ ，则 $\omega \hat{B}$ ，其中 $\hat{B}$ 是单位旋转轴对应的矩阵， $\omega$ 是旋转角。
插值：
在李代数中线性插值：
$B (t) = tB$
然后映射回 SO(3)：
$R(t) = R_1 e^{t B} = R_1 e^{t \log(R_1^T R_2)}$
当 $t = 0$ ， $R(0) = R_1$ ；当 $t = 1$ ， $R(1) = R_1 R = R_2$ 。

例子：游戏角色旋转

在游戏中，角色的朝向从 $R_1$ （面向 x 轴）变为 $R_2$ （面向 y 轴）。计算：
$R_1 = \begin{bmatrix} 1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 1 \end{bmatrix}, \quad R_2 = \begin{bmatrix} 0 & -1 & 0 \\ 1 & 0 & 0 \\ 0 & 0 & 1 \end{bmatrix}$
相对旋转：
$R = R_1^T R_2 = R_2$
对数近似（假设小角度，或使用 Rodrigues 公式反推）：
$\log R_2 \approx \frac{\pi}{2} \begin{bmatrix} 0 & -1 & 0 \\ 1 & 0 & 0 \\ 0 & 0 & 0 \end{bmatrix}$
插值路径：
$e^{t \frac{\pi}{2} \begin{bmatrix} 0 & -1 & 0 \\ 1 & 0 & 0 \\ 0 & 0 & 0 \end{bmatrix}} = \begin{bmatrix} \cos(t \frac{\pi}{2}) & -\sin(t \frac{\pi}{2}) & 0 \\ \sin(t \frac{\pi}{2}) & \cos(t \frac{\pi}{2}) & 0 \\ 0 & 0 & 1 \end{bmatrix}$
这实现了绕 z 轴的平滑旋转，保证了正交性。

几何意义

李代数 $\text{so}(3)$ 提供了一个“平坦”的空间，旋转轴和角度可以线性插值。指数映射 $e^{t B}$ 将其转化为 SO(3) 中的曲线，像是从“角速度”到“旋转角度”的积分。这种方法避免了欧拉角（Euler Angles）的万向节锁（Gimbal Lock）问题。

应用二：机器人学中的运动规划

欧几里得群（Euclidean Group, SE(3)）描述三维空间的刚体变换（旋转加平移），其李代数 $\text{se}(3)$ 由矩阵构成：
$\begin{bmatrix} B & v \\ 0 & 0 \end{bmatrix}, \quad B \in \text{so}(3), \quad v \in \mathbb{R}^3$
在机器人学中， $\text{se}(3)$ 用于优化机械臂或无人机的运动轨迹。

螺旋运动（Screw Motion）

$\text{se}(3)$ 的指数映射生成螺旋运动，结合旋转和平移。例如，考虑：
$\begin{bmatrix} B & v \\ 0 & 0 \end{bmatrix}$
其中 $B$ 是角速度矩阵， $v$ 是线速度向量。指数映射：
$e^{t A} = \begin{bmatrix} e^{t B} & V v \\ 0 & 1 \end{bmatrix}$
其中 $V$ 是旋转相关的矩阵（见第三篇博客）。

推导：路径优化

假设机械臂从位姿 $T_1 \in \text{SE}(3)$ 移动到 $T_2 \in \text{SE}(3)$ ，我们希望最小化路径的“能量”。直接在 SE(3) 上优化是复杂的非线性问题，但在 $\text{se}(3)$ 上可以通过线性化简化。

相对位姿：
$T = T_1^{-1} T_2$
映射到 $\text{se}(3)$ ：
$\log T \in \text{se}(3)$
优化目标：
假设路径为 $T(t) = T_1 e^{t A}$ ，优化角速度和线速度的范数：
$\min \int_0^1 \| A(t) \|^2 \, dt$
在 $\text{se}(3)$ 上，这是一个二次优化问题。

例子：机械臂运动

假设机械臂从位姿：
$T_1 = \begin{bmatrix} I & 0 \\ 0 & 1 \end{bmatrix}$
移动到：
$T_2 = \begin{bmatrix} \begin{bmatrix} 0 & -1 & 0 \\ 1 & 0 & 0 \\ 0 & 0 & 1 \end{bmatrix} & \begin{bmatrix} 1 \\ 0 \\ 0 \end{bmatrix} \\ 0 & 1 \end{bmatrix}$
计算相对位姿并取对数（近似）：
$\log T_2 \approx \begin{bmatrix} \begin{bmatrix} 0 & -\frac{\pi}{2} & 0 \\ \frac{\pi}{2} & 0 & 0 \\ 0 & 0 & 0 \end{bmatrix} & \begin{bmatrix} 1 \\ 0 \\ 0 \end{bmatrix} \\ 0 & 0 \end{bmatrix}$
路径：
$T(t) = e^{t A}$
这描述了绕 z 轴旋转 $\frac{\pi}{2}$ 同时沿 x 轴平移的过程。优化可通过 $\text{se}(3)$ 的线性结构调整 $A$ 的分量。

几何意义

$\text{se}(3)$ 将刚体运动分解为旋转和平移的“速度”，指数映射生成平滑的螺旋路径。几何上， $\text{se}(3)$ 是 SE(3) 的“切空间”，提供了局部线性化的工具，方便梯度下降等优化方法。

应用三：机器学习中的流形优化

在机器学习中，许多问题涉及在李群上优化，例如神经网络的正交约束或机器人数据的流形学习。李群（如 SO(n)）的非欧几里得结构需要特殊的优化方法，而李代数提供了解决方案。

李代数上的导数

假设我们优化一个旋转矩阵 $\in \text{SO}(n)$ ，目标是最小化损失函数 $f (R)$ 。直接在 SO(n) 上计算梯度是复杂的，因为 $R$ 受正交约束 $R^T R = I$ 。使用李代数 $\text{so}(n)$ 简化问题。

推导：梯度下降

参数化：
表示 $R = e^B$ ，其中 $\in \text{so}(n)$ 是反对称矩阵。
导数：
损失函数变为 $f(e^B)$ 。在 $\text{so}(n)$ 上计算导数：
$\frac{d}{dt} f(e^{B + t A}) \bigg|_{t=0}$
其中 $\in \text{so}(n)$ 是扰动方向。梯度可以通过矩阵内积表示：
$\langle \nabla_B f, A \rangle = \text{tr} \left( (\nabla f)^T A \right)$
更新：
更新 $B$ ：
$\gets B - \eta \nabla_B f$
然后映射回 SO(n)：
$\gets e^B$

例子：正交化神经网络

在深度学习中，正交矩阵用于保持信号的稳定性（例如在 RNN 或 GAN 中）。优化目标可能是：
$\min_{R \in \text{SO}(n)} \| R X - Y \|^2$
其中 $X, Y$ 是数据矩阵。参数化 $R = e^B$ ，梯度为：
$\nabla_B f = \text{skew} \left( e^B (R X - Y) X^T \right)$
其中 $\text{skew}(M) = \frac{M - M^T}{2}$ 确保反对称性。通过李代数迭代优化，保证 $R$ 始终在 SO(n) 上。

几何意义

李代数 $\text{so}(n)$ 是 SO(n) 的“局部坐标系”，将非线性流形优化转化为线性空间的优化。几何上，李代数像是“切平面”，梯度下降在切平面内移动，再通过指数映射回到流形。

综合例子：从动画到机器人

考虑一个综合场景：一个机器人手臂在 3D 动画中执行任务。手臂的位姿由 SE(3) 描述，动画需要平滑插值，机器人需要优化路径。

动画插值：
使用 $\text{se}(3)$ 的对数映射计算从 $T_1$ 到 $T_2$ 的相对变换 $A$ ，然后插值 $T(t) = e^{t A}$ ，确保平滑的螺旋运动。
路径优化：
在 $\text{se}(3)$ 上优化 $A$ 的分量，最小化能量或避障约束，使用梯度下降。
正交约束：
如果涉及传感器数据处理（例如姿态估计），使用 $\text{so}(3)$ 优化旋转矩阵，保持正交性。

几何意义

李群和李代数将复杂的非线性问题分解为局部线性和全局约束。 $\text{se}(3)$ 的螺旋运动像是“螺丝拧动”， $\text{so}(3)$ 的旋转像是“绕轴转动”，这些几何图像帮助我们设计直观的算法。

直观总结

计算机图形学： $\text{so}(3)$ 用于平滑旋转插值，避免万向节锁。
机器人学： $\text{se}(3)$ 描述螺旋运动，优化运动规划。
机器学习：李代数简化流形优化，保持几何约束。
几何意义：李代数是“速度”，李群是“位置”，指数映射连接两者，提供了局部与全局的桥梁。
核心优势：李群保持几何结构，李代数提供线性化工具，共同解决非线性问题。

通过这六篇博客，我们从李群与李代数的基础理论到实际应用，构建了一个完整的知识体系。希望你现在不仅理解了这些数学工具的优雅，还能感受到它们在计算机科学中的强大力量！未来，你可以进一步探索李群上的微分几何或更复杂的李代数（如 $\text{sp}(n)$ ），开启更广阔的旅程。

后记

2025年4月12日于上海，在grok 3大模型辅助下完成。

李群与李代数在计算机中的应用

李群与李代数的核心优势

应用一：计算机图形学中的旋转与插值

平滑旋转插值

推导

例子：游戏角色旋转

几何意义

应用二：机器人学中的运动规划

螺旋运动（Screw Motion）

推导：路径优化

例子：机械臂运动

几何意义

应用三：机器学习中的流形优化

李代数上的导数

推导：梯度下降

例子：正交化神经网络

几何意义

综合例子：从动画到机器人

几何意义

直观总结

后记

猜你喜欢

目录

热门文章