《线性代数的几何意义》学习笔记(持续更新)

第一章 什么是线性代数

代数的功能是把许多看似不相关的事物进行抽象,以提高效率,把许多看似不相关的问题化归为一类问题。

1.1 线性的几何意义

一元线性函数的概念

  1. 定义: f ( x ) = k x f(x) = kx (注: f ( x ) = a x + b f(x) = ax+b 在这里不再称为线性函数)。
  2. 几何意义:直线。
  3. 代数意义:
    • 可加性:若 f ( x ) f(x) 是线性的,则有 f ( x 1 + x 2 ) = f ( x 1 ) + f ( x 2 ) f(x_1+x_2) = f(x_1)+f(x_2) 。说明:所有起因的累加所导致的结果完全等于每个起因独自所引起的结果的累加;
    • 比例性(齐次性/数乘性/均匀性):若 f ( x ) f(x) 是线性的,则有 f ( k x ) = k f ( x ) f(kx) = kf(x) 。说明:没有输入信号时输出也为零,有几倍的输入量刚好就有几倍的输出量,增量是倍数关系,存量也是倍数关系;
    • 以上两条性质合并起来: f ( k x 1 + k x 2 ) = k f ( x 1 ) + k f ( x 2 ) f(kx_1+kx_2) = kf(x_1)+kf(x_2) ,即:线性组合的函数,等于函数的线性组合

多元线性函数的几何意义:从一元线性函数如何推广到 n n 元线性函数

f ( x 1 ) = k 1 x 1 f(x_1) = k_1x_1 扩展到 f ( x 1 , x 2 ) = k 1 x 1 + k 2 x 2 f(x_1,x_2) = k_1x_1+k_2x_2

  1. f ( x 1 ) = k 1 x 1 f(x_1) = k_1 x_1 f ( x 1 , x 2 ) = k 1 x 1 f(x_1,x_2) = k_1x_1 :二维平面坐标系 x 1 f ( x 1 ) x_1\sim f(x_1) 里有一根直线图形 f ( x 1 ) = k 1 x 1 f(x_1) = k_1 x_1 ,从原点以垂直于原坐标系“生长”出坐标轴 x 2 x_2 。原直线 f ( x 1 ) = k 1 x 1 f(x_1) = k_1x_1 沿着坐标轴 x 2 x_2 滑动,无数个平行的直线被 x 2 x_2 轴“串”起来,平铺得到平面 f ( x 1 , x 2 ) = k 1 x 1 f(x_1,x_2) = k_1 x_1 ,其是由无数的直线铺成的,因此,平面也是“线性”的
  2. f ( x 1 , x 2 ) = k 1 x 1 f(x_1,x_2) = k_1 x_1 f ( x 1 , x 2 ) = k 1 x 1 + k 2 x 2 f(x_1,x_2) = k_1 x_1+k_2 x_2 :如图所示,将 f ( x 1 , x 2 ) = k 1 x 1 f(x_1,x_2) = k_1 x_1 (白色)与 f ( x 1 , x 2 ) = k 2 x 2 f(x_1,x_2) = k_2 x_2 (白色)叠加,得到一个仍过原点 O O 的平面(彩色)。

图1.1.1 彩色平面为叠加后的平面

f ( x 1 , x 2 ) = k 1 x 1 + k 2 x 2 f(x_1,x_2) = k_1 x_1+k_2 x_2 继续扩展到 f ( x 1 , x 2 , , x n ) = k 1 x 1 + k 2 x 2 + + k n x n f(x_1,x_2,\cdots,x_n) = k_1 x_1+k_2 x_2+\cdots +k_n x_n

可以想象,由二元线性函数 f ( x 1 , x 2 ) = k 1 x 1 + k 2 x 2 f(x_1,x_2) = k_1 x_1+k_2 x_2 继续扩展到三元及 n n 元的线性函数 f ( x 1 , x 2 , , x n ) = k 1 x 1 + k 2 x 2 + + k n x n f(x_1,x_2,\cdots,x_n) = k_1 x_1+k_2 x_2+\cdots +k_n x_n (坐标系扩展到四维及 n n 维)后,其几何图形是一个扩展意义上的“平面”,称为超平面。

1.2 线性映射和线性变换的几何意义

线性映射

定义

T : x y , x k x T: \boldsymbol{x} \rightarrow \boldsymbol{y}, \boldsymbol{x} \mapsto k \boldsymbol{x} 表示从自变量数的集合 x \boldsymbol x 到因变量数的集合 y \boldsymbol y 的映射(一个动作),其中 T T 称为线性算子

几何意义

一维线性函数式的情形

图1.2.1 集合映射

图中给出了一元线性齐次函数 f ( x ) = k x f (x) = kx k k 取不同的数时的映射对应关系。在三个图中,有一
个共性就是元素 0 0 必然映射到元素 0 0 这是线性映射的最基本要求

对于一元线性齐次函数 f ( x ) = k x f (x) = kx ,集合 x \boldsymbol x 和集合 y \boldsymbol y 都是实数,因此可以分别用一坐标轴表示。这样,我们就可以用坐标轴上点之间的映射,来替代图1.2.1的映射。


图1.2.2-1 坐标轴映射 (1)

图1.2.2-2 坐标轴映射 (2)

如果把两个坐标轴的原点重合(因为 0 0 必然映射到 0 0 ),再把两个坐标轴的夹角调整到 π 2 \dfrac \pi 2 ,就得到了笛卡尔坐标系( k > 0 k>0 的情况),如图1.2.2-2左所示。

图中 a a b b 分别映射到 a a’ b b’ ,如果把点 a a a a' b b b b' 分别与原点 O O 连起来,就会得到线段 O a Oa O b Ob O a Oa’ O b Ob' 。也就是说:线性映射就是把线段映射到线段。也可以说:线性映射就是把向量映射成向量

同样,线性映射也满足线性的可加性和比例性的性质(如图1.2.2-2右):

  • 可加性: x x 轴上的两向量的和,映射到 y y 轴得到两个 x x 轴向量分别映射得到的 y y 轴向量的和,表示为 T ( α + β ) = T α + T β T(\vec \alpha + \vec \beta) = T\vec \alpha + T \vec \beta
  • 比例性: x x 轴向量的倍数映射到的 y y 轴向量等于 x x 轴向量映射的 y y 轴向量的倍数,表示为 T ( k α ) = k T α T(k\vec \alpha) = kT\vec \alpha

其中, T : x y , x k x T: \boldsymbol{x} \rightarrow \boldsymbol{y}, \boldsymbol{x} \mapsto k \boldsymbol{x}

二维线性函数式的情形

考察二维线性函数式:
y = K x ( y 1 y 2 ) = [ a 1 a 2 b 1 b 2 ] ( x 1 x 2 ) \vec y = \boldsymbol K \vec x \quad \Leftrightarrow \quad \left(\begin{array}{l} {y_{1}} \\ {y_{2}} \end{array}\right)=\left[\begin{array}{ll} {a_{1}} & {a_{2}} \\ {b_{1}} & {b_{2}} \end{array}\right]\left(\begin{array}{l} {x_{1}} \\ {x_{2}} \end{array}\right)
因为向量 x \vec x y \vec y 都是二维向量,所有任意的向量 x \vec x 的集合将构成平面 π 1 \pi_1 ,所有任意的向量 y \vec y 的集合将构成平面 π 2 \pi_2 ,并在两个平面上分别构建平面直角坐标系。因而,二维线性函数就构成了两个二维平面之间由矩阵 K = [ a 1 a 2 b 1 b 2 ] \boldsymbol{K}=\left[\begin{array}{ll} {a_{1}} & {a_{2}} \\ {b_{1}} & {b_{2}} \end{array}\right] 所确定的映射关系。


图1.2.3

将两个平面的原点重合并垂直相交,得到三维空间。例如,矩阵 K \boldsymbol K π 1 \pi_1 平面上的向量 α 1 \vec \alpha_1 映射为 π 2 \pi_2 平面上的向量 β 1 \vec \beta_1 ,这也同样满足可加性、比例性(如图1.2.3右)和线性可加性(如图1.2.4)


图1.2.4 三维空间映射-线性可加性

不难发现,由于平行四边形法则,一个平面上的平行四边形,映射到另一平面后变为另一平行四边形(他们可能全等、相似或既不全等也不相似)。同样也可能由一个圆,映射为圆、椭圆或者一根线段,特别情况下被映射为原点(如图1.2.5)。


图1.2.5 三维空间映射-圆映射为椭圆

线性变换

若数域 F F 上线性空间 V V 中的变换 T T 若满足条件
T ( α + β ) = T α + T β ( α , β V ) T ( k α ) = k T α ( k F , α V ) T(\vec \alpha + \vec \beta) = T\vec \alpha + T \vec \beta \quad(\vec \alpha , \vec \beta \in V)\\ T(k \vec \alpha) = kT\vec \alpha \quad(k \in F , \vec \alpha \in V)
则称为 V V 中的线性变换。也就是说,如果映射是发生在一个集合上的同一个坐标系中,线性映射就被称为线性变换。


图1.2.6 线性变换

例如,在二维向量空间中,把所有向量绕原点作同样角度的旋转是一个线性变换(旋转变换),在三维向量空间中,把每一个向量投影在坐标面 x O y xOy 上,也是一个线性变换(投影变换),不难发现,它们都符合可加性和比例性。


第二章 向量的基本几何意义

2.1 向量概念的几何意义

自由向量

  • 一个确定的向量不允许改变方向。
  • 在一条直线上平移的向量称为自由向量(滑动向量)。
  • 大小相等、方向相同的两个向量相等。因此,一个向量在保持长度和方向不变的条件下可以自由平移。

向量的数学表示

  • n n 维空间向量以 n n 维向量空间中的原点作为起点。
  • 用有序数组表示,或分解为 n n 个单位坐标向量的线性表示。
  • 向量没有除法。

2.3 向量的内积(点积,数量积)

  • 定义:
    a b = a b cos θ a b = a x b x + a y b y + a z b z \vec a \cdot \vec b = ab\cos \theta\\ \vec a \cdot \vec b = a_xb_x+a_yb_y+a_zb_z

  • 几何意义:一个向量在另一个向量上的投影的积;内积值越大,两个向量的在方向上就越接近;内积值
    越小,两个向量的在方向上就越相反;内积值为0,两向量垂直。

  • 一个重要结论:若 a \vec a 为某个坐标轴的单位坐标向量,则 a b \vec a \cdot \vec b 就是就是 b \vec b 在此坐标轴上的坐标值 。

  • 正交变换:

    • 定理1:设 σ \sigma V V 的一个变换。若 a , b \forall \vec a, \vec b 都有
      σ ( a ) + σ ( b ) = a + b \left| \sigma(\vec a)+\sigma(\vec b) \right| = \left| \vec a+\vec b\right|
      σ \sigma V V 正交变换。其几何意义是“保持以 V V 中任意两个向量为邻边的平行四边形的对角线之长不变” 。

    • 定理2:设 σ \sigma V V 的一个变换。若 σ \sigma 既是保长度变换又是保夹角变换,则 σ \sigma 必为正交变换

2.4 向量的外积(叉积,向量积)

  • 定义:
    • a × b = ( a y b z a z b y ,   a z b x a x b z ,   a x b y a y b x ) \vec a \times \vec b = \left(a_{y} b_{z}-a_{z} b_{y}, \ a_{z} b_{x}-a_{x} b_{z},\ a_{x} b_{y}-a_{y} b_{x}\right)
    • a × b = a b sin θ e ^ n \vec a \times \vec b = \left| \vec a \right| \left| \vec b \right| \sin \theta \hat e_{\rm n}
  • 几何意义:叉积的模长等于 a , b \vec a, \vec b 构成的平行四边形的面积。
  • 物理意义:如 v = ω × r \vec v = \vec \omega \times \vec r
  • a × c 0 \vec a \times \vec c_0 的几何意义( c 0 \vec c_0 为单位向量):

图2.4.1 的几何意义

2.5 向量混合运算的几何意义

向量叉积的分配律 ( a + b ) × c = a × c + b × c \left( \vec a +\vec b \right) \times \vec c = \vec a \times \vec c + \vec b \times \vec c 的几何解释

  • 解释一(“一投一转,再加一伸”): a \vec a b \vec b a + b \vec a + \vec b 分别按照[此方法](#2.4 向量的外积(向量积))作出 a \vec a' b \vec b' a + b \vec a' + \vec b’ 以及 a × c 0 \vec a\times \vec c_0 b × c 0 \vec b\times \vec c_0 ( a + b ) × c 0 \left(\vec a + \vec b\right) \times \vec c_0 ,显然,这三组向量都可构成平行四边形,即
    a × c 0 + b × c 0 = ( a + b ) × c 0 \vec a\times \vec c_0+\vec b\times \vec c_0=\left(\vec a + \vec b\right) \times \vec c_0
    再将单位向量 c 0 \vec c_0 伸缩为一般的向量 c = c c 0 \vec c = \left| \vec c\right| \vec c_0 ,即等式两边同乘常数 c \left| \vec c\right| ,得:
    a × c 0 c + b × c 0 c = ( a + b ) × c 0 c a × c + b × c = ( a + b ) × c ( a + b ) × c = a × c + b × c \begin{aligned} \vec a\times \vec c_0\left| \vec c\right|+\vec b\times \vec c_0\left| \vec c\right| &= \left(\vec a + \vec b\right) \times \vec c_0\left| \vec c\right|\\ \vec a\times \vec c+\vec b\times \vec c &= \left(\vec a + \vec b\right) \times \vec c\\ \left( \vec a +\vec b \right) \times \vec c &= \vec a \times \vec c + \vec b \times \vec c \end{aligned}

图2.5.1 向量叉积的分配律的几何解释1
  • 解释二(面向量):面向量的加法运算同样满足平行四边形法则和三角形法则,具体过程略。

图2.5.2 向量叉积的分配律的几何解释2

向量混合积 ( a × b ) c \left(\vec a \times \vec b \right) \cdot \vec c 的几何解释

( a × b ) c = ( b × c ) a = ( c × a ) b \left(\vec a \times \vec b \right) \cdot \vec c = \left(\vec b \times \vec c \right) \cdot \vec a = \left(\vec c \times \vec a \right) \cdot \vec b ,其绝对值表示以这三个向量为棱的平行六面体的体积。如果它们顺序组成右手系,那么积符号为正,反之为负。


图2.5.3 向量混合积的几何解释

2.6 向量的积和张量之间的关系

a , b \vec{a}, \vec{b} 的张量积: a b = a x b x i i + a y b y j j + ( a x b y i j + a y b x j i ) \vec{a} \vec{b}=a_{x} b_{x} \vec{i} \vec{i}+a_{y} b_{y} \vec{j} \vec{j}+\left(a_{x} b_{y} \vec{i} \vec{j}+a_{y} b_{x} \vec{j} \vec{i}\right) ,其第一部分包含了 a \vec a b \vec b 内积的结果,第二部分包含了 a \vec a b \vec b 外积或行列式的结果,即:
a b = ( a b ) + ( a × b ) \vec{a} \vec{b}=\left(\vec{a} \cdot \vec{b}\right)+\left(\vec{a} \times \vec{b}\right)

2.7 向量有没有除法

点积的除法和叉积的除法


图2.7.1 点积的除法和叉积的除法的几何解释

假设 a b = c \vec a \cdot \vec b = c a × b = c \vec a \times \vec b = \vec c ,且已知 a ,   c ,   c \vec a,\ c,\ \vec c ,求 b \vec b 。根据上图可以发现, b ,   b ,   b ,   b \vec b,\ \vec b’,\ \vec b’’,\ \vec b’’' 都满足等式,故点积和叉积均没有除法。

通过联立求解除法的表达式

解方程
{ a b = c a × b = c \left\{\begin{array}{l} \vec{a} \cdot \vec{b}=c \\ \vec{a} \times \vec{b}=\vec{c} \end{array}\right.
可解得向量除法的表达式
b = c a a × c a a \vec{b}=\frac{c \vec{a}-\vec{a} \times \vec{c}}{\vec{a} \cdot \vec{a}}

2.8 向量的投影和的几何解释

  • 多个或有限个向量的和在任意轴上投影等于各个向量在同一轴上投影的和。

图2.8.1 多个向量在任意轴上的投影和的几何解释
  • 多个或有限个向量的和在任意平面上投影等于各个向量在同一平面上投影的和。

图2.8.2 多个向量在任意平面上的投影和的几何解释

2.9 变向量的几何意义

二维变向量的几何图形

在二维平面上,二维向量 ( x 1 , x 2 ) (x_1,x_2) 的两个分量全部为可变量,称之为二维变向量。若 x 1 , x 2 x_1,x_2 取遍所有实数,则其表示整个二维平面。若:

  • 固定 x 1 x_1 (或 x 2 x_2 )为 a a ,则所有向量的末端在一条竖直(或水平)的直线上,因而表示一条直线;

  • 向量的分量之间有线性关系,如 x 2 = a x 1 + b x_2 = ax_1+b ,则所有向量的末端在直线 x 2 = a x 1 + b x_2 = ax_1+b 上,因而表示直线 x 2 = a x 1 + b x_2 = ax_1+b


    图2.9.1 二维变向量的分量之间有线性关系

    ( x 1 , a x 1 + b ) \left(x_1, ax_1+b\right) 可表示为 ( x 1 , a x 1 + b ) = ( x 1 , a x 1 ) + ( 0 , b ) \left(x_1, ax_1+b\right)=(x_1,ax_1)+(0,b) ,几何解释为:直线 ( x 1 , a x 1 + b ) \left(x_1, ax_1+b\right) 是由直线 ( x 1 , a x 1 ) (x_1,ax_1) 沿向量 ( 0 , b ) (0,b) 平移 b b 得到的。


图2.9.2 的几何解释

三维变向量的几何图形

x 1 , x 2 , x 3 x_1,x_2,x_3 取遍所有实数,则其表示整个三维空间。若:

  • ( x 1 , x 2 , x 3 ) (x_1,x_2,x_3) 中一个变量取为定值时,分别表示垂直于三个坐标轴的平面;

  • ( x 1 , x 2 , x 3 ) (x_1,x_2,x_3) 中两个变量取为定值时,如 ( a 1 , a 2 , x 3 ) (a_1,a_2,x_3) 表示平行于 x 3 x_3 轴的直线 { x 1 = a 1 x 2 = a 2 \left\{\begin{array}{l} x_{1}=a_{1} \\ x_{2}=a_{2} \end{array}\right.


    图2.9.3 的几何图形
  • 当有线性关系时,如 ( x 1 , x 2 , a x 1 + b x 2 ) (x_1,x_2,ax_1+bx_2) 可进行向量分解,表示为
    ( x 1 , x 2 , a x 1 + b x 2 ) = ( x 1 , 0 , a x 1 ) + ( 0 , x 2 , b x 2 ) = x 1 ( 1 , 0 , a ) + x 2 ( 0 , 1 , b ) \begin{aligned} (x_1,x_2,ax_1+bx_2)&=\left(x_{1}, 0, a x_{1}\right)+\left(0, x_{2}, b x_{2}\right)\\ &=x_{1}(1,0, a)+x_{2}(0,1, b) \end{aligned}
    x 1 , x 2 x_1,x_2 独立取遍所有实数时, x 1 ( 1 , 0 , a ) + x 2 ( 0 , 1 , b ) x_{1}(1,0, a)+x_{2}(0,1, b) 所形成的无数个向量覆盖了一个平面。实际上,这是一个被常向量 ( 1 , 0 , a ) (1,0,a) ( 0 , 1 , b ) (0,1,b) 所张成的向量空间,记作 s p a n { ( 1 , 0 , a ) , ( 0 , 1 , b ) } {\rm span}\left\{ (1,0,a),(0,1,b)\right\} 。因此有以下等式:
    ( x 1 , x 2 , a x 1 + b x 2 ) = s p a n { ( 1 , 0 , a ) , ( 0 , 1 , b ) } (x_1,x_2,ax_1+bx_2) = {\rm span}\left\{ (1,0,a),(0,1,b)\right\}
    类似地 ( x 1 , x 2 , a x 1 + b x 2 + c ) = ( x 1 , x 2 , a x 1 + b x 2 ) + ( 0 , 0 , c ) (x_1,x_2,ax_1+bx_2+c) = (x_1,x_2,ax_1+bx_2)+(0,0,c) 同样表示 ( x 1 , x 2 , a x 1 + b x 2 ) (x_1,x_2,ax_1+bx_2) 的平面沿着向量 ( 0 , 0 , c ) (0,0,c) 平移了 c c

变向量的应用

二阶线性方程组 { x 2 = a 1 x 1 + b 1 x 2 = a 2 x 1 + b 2 \left\{\begin{array}{l} x_{2}=a_{1} x_{1}+b_{1} \\ x_{2}=a_{2} x_{1}+b_{2} \end{array}\right. 可以用变向量的交 ( x 1 , a 1 x 1 + b 1 ) ( x 1 , a 2 x 1 + b 2 ) \left(x_{1}, a_{1} x_{1}+b_{1}\right) \bigcap\left(x_{1}, a_{2} x_{1}+b_{2}\right) 来等价表示。可以想象,两个变向量相同的向量就是他们的交集。如果两个向量相同,那么向量的夹角就会为零,根据行列式的几何意义知道,此时行列式为零,即
x 1 a 1 x 1 + b 1 x 1 a 2 x 1 + b 2 = 0 \left|\begin{array}{ll} x_{1} & a_{1} x_{1}+b_{1} \\ x_{1} & a_{2} x_{1}+b_{2} \end{array}\right|=0
化简得到 x 1 = 0 x_1 = 0 x 1 = b 1 b 2 a 2 a 1 x_1 = \dfrac{b_1-b_2}{a_2-a_1} ,进而得到两对线性相关的向量: ( 0 , b 1 ) ,   ( 0 , b 2 ) (0,b_1),\ (0,b_2) ( b 1 b 2 a 2 a 1 , a 2 b 1 a 1 b 2 a 2 a 1 ) ,   ( b 1 b 2 a 2 a 1 , a 2 b 1 a 1 b 2 a 2 a 1 ) \left(\dfrac{b_{1}-b_{2}}{a_{2}-a_{1}}, \dfrac{a_{2} b_{1}-a_{1} b_{2}}{a_{2}-a_{1}}\right),\ \left(\dfrac{b_{1}-b_{2}}{a_{2}-a_{1}}, \dfrac{a_{2} b_{1}-a_{1} b_{2}}{a_{2}-a_{1}}\right) ,其中第二对是重合的,也就是线性方程组的解。


第三章 行列式的几何意义

3.1 行列式的定义及几何意义

定义

行列式是由一些数据排列成的方阵经过规定的计算方法而得到的一个数。

几何意义

解释1

行列式就是行列式中的行(或列向量)所构成的超平行多面体的有向面积有向体积

例如,一个2×2矩阵 A \boldsymbol A 的行列式等于 A \boldsymbol A 的行向量(或列向量)决定的平行四边形的有向面积。从几何的观点来看,二阶行列式 D = a 1 a 2 b 1 b 2 D=\left|\begin{array}{l} a_{1} & a_{2} \\ b_{1} & b_{2} \end{array}\right| x O y xOy 平面上以行向量 a = ( a 1 , a 2 ) , b = ( b 1 , b 2 ) \vec a= (a_1,a_2), \vec b = (b_1,b_2) 为邻边的平行四边形的有向面积:若这个平行四边形是由向量 a \vec a 沿逆时针方向转到 b \vec b 而得到的,面积取正值,反之取负值。

类似地,三阶行列式的值就是它的三个向量在 O x y z Oxyz 空间上张成的平行六面体的有向体积。同样当 a , b , c \vec a,\vec b,\vec c 构成右手系时,体积取正值,反之取负值。

解释2

矩阵 A \boldsymbol A 的行列式 det A \det \boldsymbol A 就是线性变换 A \boldsymbol A 下的图形面积或体积的伸缩因子。

例如,假设 A \boldsymbol A 是一个列向量(或行向量)为 a , b \vec a, \vec b 的2×2矩阵。那么,这里的线性变换 A \boldsymbol A 是指将 R 2 \mathbb R^2 中 的单位正方形,变成 R 2 \mathbb R^2 中以 a , b \vec a, \vec b 为邻边的平行四边形;如果原图形为一个圆,则线性变换 A \boldsymbol A 将之变成一个椭圆。

解释3

二阶行列式表示两个行向量(或列向量)的叉积的数值,这个数值是 z z 轴上的叉积分量。如果数值是正值,则与 z z 轴正向同向,反之反向。

类似地,三阶行列式表示三个行向量(或列向量)混合积的数值。前面两个向量叉积的方向若与第三个向量夹角为锐角或直角,则为正值,反之为负值。

3.2 二阶行列式性质的几何解释

性质1

k a 1 a 2 b 1 b 2 = k a 1 k a 2 b 2 b 2 k\left|\begin{array}{l} a_{1} & a_{2} \\ b_{1}& b_{2} \end{array}\right|=\left|\begin{array}{c} k a_{1}& k a_{2} \\ b_{2}& b_{2} \end{array}\right|

几何解释略。

性质2

a 1 a 2 b 1 + c 1 b 2 + c 2 = a 1 a 2 b 1 b 2 + a 1 a 2 c 1 c 2 \left|\begin{array}{c} a_{1}& a_{2} \\ b_{1}+c_{1} & b_{2}+c_{2} \end{array}\right|=\left|\begin{array}{c} a_{1}& a_{2} \\ b_{1}& b_{2} \end{array}\right|+\left|\begin{array}{c} a_{1} & a_{2} \\ c_{1} & c_{2} \end{array}\right|


图3.2.1 性质2

性质3

a 1 a 2 k a 1 k a 2 = 0 \left|\begin{array}{c} a_{1} & a_{2} \\ k a_{1} & k a_{2} \end{array}\right|=0

即行列式两行对应元素成比例,则行列式为零。

对于 a = ( a 1 , a 2 ) ,   b = ( k a 1 , k a 2 ) = k a \vec a = (a_1,a_2),\ \vec b = (ka_1,ka_2) = k\vec a ,如果把它们的起点都移动到原点,则两向量共线,围成的平行四边形面积为0,行列式因而为0。

性质4

a 1 a 2 b 1 b 2 = b 1 b 2 a 1 a 2 \left|\begin{array}{l} a_{1}& a_{2} \\ b_{1}& b_{2} \end{array}\right|=-\left|\begin{array}{l} b_{1}& b_{2} \\ a_{1}& a_{2} \end{array}\right|

这可以由行列式几何意义的解释3看出。

性质5

a 1 a 2 b 1 b 2 = a 1 a 2 b 1 + λ a 1 b 2 + λ a 2 \begin{array}{l} \left|\begin{array}{l} a_{1}& a_{2} \\ b_{1}& b_{2} \end{array}\right|=\left|\begin{array}{cc} a_{1} & a_{2} \\ b_{1}+\lambda a_{1} & b_{2}+\lambda a_{2} \end{array}\right| \end{array}

即,把行列式的一行的 k k 倍加到另一行,则行列式值不变。

等式右侧的行列式中,第二个行向量表示 b + λ a \vec b + \lambda \vec a


图3.2.2 性质5

性质6

a 1 a 2 b 1 b 2 = a 1 b 1 a 2 b 2 \left|\begin{array}{l} a_{1}& a_{2} \\ b_{1}& b_{2} \end{array}\right|=\left|\begin{array}{l} a_{1}& b_{1} \\ a_{2}& b_{2} \end{array}\right|

即,矩阵的行列式等于其转置矩阵的行列式。

3.3 三阶行列式性质的几何解释

性质1

det ( a , b , c + d ) = det ( a , b , c ) + det ( a , b , d ) \det \left(\vec a, \vec b, \vec c+\vec d\right) = \det \left(\vec a, \vec b, \vec c\right) + \det \left(\vec a, \vec b, \vec d\right)

即,一个行列式可以通过拆分某一个列向量得到两个行列式的和。


图3.3.1 性质1的两种解释

第二种解释可以很好地说明有向体积也满足三角形法则。

性质2

det ( a , a , c ) = 0 \det \left(\vec a, \vec a, \vec c\right) = 0

平行六面体的两条邻边重合,相当于三维空间中六面体被压成了高度为零的二维平面,显然体积为0。

性质3

det ( a , b , c ) = det ( b , a , c ) \det \left(\vec a, \vec b, \vec c\right) = -\det \left(\vec b, \vec a, \vec c\right)

参考行列式几何意义的第三种解释,事实上, det ( a , b , c ) = ( a × b ) c = ( b × a ) c = det ( b , a , c ) = det ( b , a , c ) \det \left(\vec a, \vec b, \vec c\right) = \left(\vec a \times \vec b \right)\cdot \vec c = -\left(\vec b \times \vec a \right)\cdot \vec c = -\det \left(\vec b, \vec a, \vec c\right)=\det \left(\vec b, \vec a, -\vec c\right)

性质4

k det ( a , b , c ) = det ( k a , b , c ) = det ( a , k b , c ) = det ( a , b , k c ) k\det \left(\vec a, \vec b, \vec c\right) = \det \left(k\vec a, \vec b, \vec c\right)=\det \left(\vec a, k\vec b, \vec c\right)=\det \left(\vec a, \vec b, k\vec c\right)


图3.3.2 性质4

性质5

det ( a , b , c ) = det ( a , b , k a + c ) \det \left(\vec a, \vec b, \vec c\right)=\det \left(\vec a, \vec b, k\vec a +\vec c\right)


图3.3.3 性质5

性质6

det A = det A T \det \boldsymbol A = \det \boldsymbol A^{\rm T}

3.4 行列式化为对角形的几何解释

对二阶行列式进行化简:
a 1 a 2 b 1 b 2 = a 1 a 2 0 a 1 b 2 a 2 b 1 a 1 = a 1 0 0 a 1 b 2 a 2 b 1 a 1 \left|\begin{array}{ll} a_{1} & a_{2} \\ b_{1} & b_{2} \end{array}\right|=\left|\begin{array}{cc} a_{1} & a_{2} \\ 0 & \dfrac{a_{1} b_{2}-a_{2} b_{1}}{a_{1}} \end{array}\right| =\left|\begin{array}{cc} a_{1} & 0 \\ 0 & \dfrac{a_{1} b_{2}-a_{2} b_{1}}{a_{1}} \end{array}\right|
其对应的几何图形有如下的变化:


图3.4.1 行列式化为对角形的几何解释

平行四边形变成了矩形,显然面积不变。

三阶行列式有类似的变换情形,对角化的过程会把一个平行六面体变化为一个等体积的立方体或长方体。

3.5 行列式乘积项的几何意义

  • 二阶行列式的两项分别为两个有向的矩形面积,方向通过右手法则判断;
  • 三阶行列式的六项分别为六个有向的长方体的体积,方向通过右手法则判断;
  • n n 阶行列式的 n ! n! 项分别为 ( 1 ) t a 1 j 1 a 2 j 2 a n j n (-1)^{t} a_{1 j_{1}} a_{2 j_{2}} \dots a_{n j_{n}} t t 为排列 j 1 j 2 j n j_{1} j_{2} \dots j_{n} 的逆序数。行列式的各行向量在各个坐标轴上的分量(即投影)就是行列式中的元素。

3.6 克莱姆法则的几何意义

克莱姆法则适用于解方程个数等于未知数个数的线性方程组,且系数行列式不等于 0。

二阶克莱姆法则的几何解释

二阶线性方程组
{ a 1 x + b 1 y = c 1 a 2 x + b 2 y = c 2 ( a b ) x = c \left\{\begin{array}{l} a_{1} x+b_{1} y=c_{1} \\ a_{2} x+b_{2} y=c_{2} \end{array}\right.\quad \Leftrightarrow \quad \left(\vec a \quad\vec b\right)\vec x = \vec c
其中
a = ( a 1 a 2 ) ,   b = ( b 1 b 2 )   , c = ( c 1 c 2 ) ,   x = ( x y ) \vec{a}=\left(\begin{array}{l} a_{1} \\ a_{2} \end{array}\right),\ \vec{b}=\left(\begin{array}{l} b_{1} \\ b_{2} \end{array}\right)\ , \vec{c}=\left(\begin{array}{l} c_{1} \\ c_{2} \end{array}\right),\ \vec{x}=\left(\begin{array}{l} x \\ y \end{array}\right)
构造
x a b = x a b = x a + y b b = c b x\left|\vec{a}\quad \vec{b}\right|=\left|x \vec{a}\quad \vec{b}\right|=\left|x \vec{a}+y \vec{b}\quad \vec{b}\right|=\left| \vec{c}\quad \vec{b}\right|
可知克莱姆法则的解为:
x = c 1 b 1 c 2 b 2 a 1 b 1 a 2 b 2 , y = a 1 c 1 a 2 c 2 a 1 b 1 a 1 b 2 x=\frac{\left|\begin{array}{ll} c_{1} & b_{1} \\ c_{2} & b_{2} \end{array}\right|}{\left|\begin{array}{ll} a_{1} & b_{1} \\ a_{2} & b_{2} \end{array}\right|},\quad y=\frac{\left|\begin{array}{ll} a_{1} & c_{1} \\ a_{2} & c_{2} \end{array}\right|}{\left|\begin{array}{ll} a_{1} & b_{1} \\ a_{1} & b_{2} \end{array}\right|}
其几何解释为: x x 为由面积 S ( a , b ) S\left( \vec a,\vec b \right) 伸缩和切变到 S ( c , b ) S\left( \vec c,\vec b \right) ,变化前后的面积之比。


图3.6.1 二阶克莱姆法则的几何解释

三阶克莱姆法则的几何解释

类似地,三阶线性方程组
{ a 1 x + b 1 y + c 1 z = d 1 a 2 x + b 2 y + c 2 z = d 2 a 3 x + b 3 y + c 3 z = d 3 \left\{\begin{array}{l} a_{1} x+b_{1} y+c_{1} z=d_{1} \\ a_{2} x+b_{2} y+c_{2} z=d_{2} \\ a_{3} x+b_{3} y+c_{3} z=d_{3} \end{array}\right.
克莱姆法则的解为 x = d b c a b c ,   y ,   z x = \dfrac{\left| \vec d \quad \vec{b}\quad \vec{c}\right|}{\left| \vec a \quad \vec{b}\quad \vec{c}\right|},\ y, \ z 同理。


图3.6.2 三阶克莱姆法则的几何解释

在以上的几何解释中,除了伸缩、旋转、镜像就是切变,向量的大小和方向在变化,但没有对向量进行弯曲、扭曲变化,全部是直线段的变化。所有的变化保持直线性,这就是线性变换的本质含义。

3.7 行列式的一些应用

  • 过平面上两点 ( x 1 , y 1 ) ,   ( x 2 , y 2 ) (x_1,y_1),\ (x_2,y_2) 的直线方程为: x y 1 x 1 y 1 1 x 2 y 2 1 = 0 \left|\begin{array}{l} x & y & 1 \\ x_{1} & y_{1} & 1 \\ x_{2} & y_{2} & 1 \end{array}\right|=0
    过空间中不共线的三点 ( x 1 , y 1 , z 1 ) ,   ( x 2 , y 2 , z 2 ) ,   ( x 3 , y 3 , z 3 ) (x_1,y_1,z_1),\ (x_2,y_2,z_2),\ (x_3, y_3, z_3) 的平面方程为: x y z 1 x 1 y 1 z 1 1 x 2 y 2 z 2 1 x 3 y 3 z 3 1 = 0 \left|\begin{array}{l} x & y & z & 1 \\ x_{1} & y_{1} & z_1 & 1 \\ x_{2} & y_{2} & z_2 & 1 \\ x_3 & y_3 & z_3 & 1\\ \end{array}\right|=0
  • 过平面上三点 A i ( x i , y 1 ) ,   i = 1 , 2 , 3 A_i(x_i,y_1),\ i=1,2,3 ,且对称平行于 y y 轴的抛物线方程为: x 2 x 1 y x 1 2 x 1 1 y 1 x 2 x 2 1 y 2 x 3 x 3 1 y 3 = 0 \left|\begin{array}{cccc} x^{2} & x & 1 & y \\ x_{1}^{2} & x_{1} & 1 & y_{1} \\ x_{2} & x_{2} & 1 & y_{2} \\ x_{3} & x_{3} & 1 & y_{3} \end{array}\right|=0
  • A ( a 1 , a 2 , a 3 ) ,   B ( b 1 , b 2 , b 3 ) ,   C ( c 1 , c 2 , c 3 ) ,   D ( d 1 , d 2 , d 3 ) A(a_1,a_2,a_3),\ B(b_1,b_2,b_3),\ C(c_1,c_2,c_3),\ D(d_1,d_2,d_3) 为顶点的四面体体积为: V = ± 1 6 1 a 1 a 2 a 3 1 b 1 b 2 b 3 1 c 1 c 2 c 3 1 d 1 d 2 d 3 V=\pm \dfrac{1}{6}\left|\begin{array}{cccc} 1 & a_{1} & a_{2} & a_{3} \\ 1 & b_{1} & b_{2} & b_{3} \\ 1 & c_{1} & c_{2} & c_{3} \\ 1 & d_{1} & d_{2} & d_{3} \end{array}\right|

第四章 向量组及向量空间的几何意义

4.1 向量组的几何意义

4.1.1 线性表示、线性组合及相关的意义

线性表示与线性组合

若一个向量可以由另外一个或几个向量(即向量组)用数乘之和的形式表示出来,即
β = x 1 α 1 + x 2 α 2 + + x s α s \vec{\beta}=x_{1} \vec{\alpha}_{1}+x_{2} \vec{\alpha}_{2}+\cdots+x_{\mathrm{s}} \vec{\alpha}_{\mathrm{s}}
其中 x 1 , x 2 , x s x_{1}, x_{2}, \dots x_{s} 为常数,则称向量 β \vec \beta 可以由向量组 { α 1 , α 2 , α s } \left\{\vec{\alpha}_{1}, \vec{\alpha}_{2}, \dots \vec{\alpha}_{s}\right\} 线性表示,或向量 β \vec \beta 是向量 α 1 , α 2 , α s \vec{\alpha}_{1}, \vec{\alpha}_{2}, \dots \vec{\alpha}_{s} 的线性组合。线性表示的几何意义就是可以把一个向量依照平行四边形法则分解(或投影)为向量组上的和;向量的线性组合的几何意义就是对向量组内的向量长度进行缩放后依照平行四边形法则进行合并加。

线性相关性的几何解释

如果一个向量可以由一个向量组线性表示,我们就称这个向量和向量组线性相关。另一种说法是,一个向量组里,只要有一个向量可以由其它向量线性表示,我们就称这个向量组线性相关。反之,如果向量组里的任意一个向量都不能由其它向量线性表示,我们就称向量组线性无关

在二维平面上:

  • 两个向量线性相关 ⟺ 这两个向量共线,也可推出:不共线的两向量线性无关;
  • 任意三个向量必然线性相关

在三维空间中:三个向量不共面三个向量构成的行列式不等于0(参见行列式几何意义的解释1) ⟺ 三个向量可以构成一个平行六面体

4.1.2 向量组等价及秩的几何意义

向量组等价的几何解释

两个向量组等价就是这两个向量组能够互相被线性表示,即其中任意一个向量组中的每一个向量都可以被另一个向量组线性表示。也就是说,如果把一个向量组中的任意一个向量拿出来放到另外一个向量组中,那么另外这个
扩大的向量组就会线性相关,而且不论原向量组是否线性相关。

其几何意义为:向量组 A A 中每一个向量都在向量组 B B 张成的向量空间中;同样,向量组 B B 中的每一个向量也
在向量组 A A 张成的向量空间中。或者说,若两个向量组如果张成的向量空间相同或重合,则两个向量组等价。


图4.1.2.1 向量组等价的几何解释

例如如上图所示, α i , β i , η i \vec{\alpha}_{i}, \vec{\beta}_{i}, \vec{\eta}_{i} 分别所在的三条直线共面(阴影平行四边形), γ i \gamma_i 在该平面外。则 { α i , β j , γ k } \left\{ α_i, β_j, γ_k \right\} { α i , η j , γ k } \left\{ α_i, η_j, γ_k \right\} 是等价向量组,因为它们都可以张成整个三维空间。

向量组的秩及最大无关向量组

最大无关向量组:从原来的较长的向量组中挑出一部分向量组成了一个新的向量组,且其与原向量组等价,同时这个新的向量组中很“纯净”,没有躲在别人后面滥竽充数的向量,多余的向量被剔出了,最大无关向量组中的元素个数就是向量组的

我们可以通过几何意义来理解:

  • 在一个向量组里,如果有多个向量在一条直线上,那么这些向量只要一个向量就可以了,其他的同直线的向量可以被代表了,这个向量代表可以任意一个非零向量;
  • 进而,如果向量组里还有多个向量构成且存在于一个平面上,那么只要有两个非零、非共线的向量就可以代表其他的共面向量了;
  • 继续,如果向量组里还有多个向量构成且存在于一个立体空间里,那么只要有三个非零、非共线、非共面的向量就可以代表其它的同立体向量了……

我们可以得到如下结论:

  • 一个向量组应该可以张成一个和向量组元素个数相同的子空间,一个向量张成一维的子空间,两个向量应张成二维的字空间……;如果一个向量组 n n 个元素,张成一个小于 n n 维的子空间,那么这个向量组就线性相关;如果总是张成一个 n n 维的子空间,那么这个向量组就线性无关。

  • 向量组的秩就是可以张成的最大子空间的维数。

4.2 向量空间的几何意义

向量空间的定义:设 V V 是非空的 n n 维向量的集合( n = 1 , 2 , 3 , n=1,2,3,\dots ),若 V V 中的向量对加法和数乘两种运算封闭,即:

  • a , b V \vec a,\vec b \in V ,则 a + b V \vec a + \vec b \in V
  • a V \vec a \in V ,则 k a V k \vec a \in V k k 为任意实数。

则称 V V 为向量空间。

4.2.1 向量张成的空间

设有一个向量组 { α 1 , α 2 , , α n } \left\{ α_1, α_2, \dots, α _n \right\} ,这个向量组的所有的线性组合生成一个向量集合
s p a n { α 1 , α 2 , , α n } = { x 1 α 1 + x 2 α 2 + + x n α n x 1 , x 2 , , x n R } {\rm span}\left\{ \vec{\alpha}_{1},\vec{\alpha}_{2}, \cdots,\vec{\alpha}_{n} \right\}=\left\{x_{1} \vec{\alpha}_{1}+x_{2} \vec{\alpha}_{2} +\cdots+x_{n} \vec{\alpha}_{n} | x_{1}, x_{2}, \ldots ,x_{n} \in \mathbb R\right\}
称为由 { α 1 , α 2 , , α n } \left\{ \vec{\alpha}_{1},\vec{\alpha}_{2}, \cdots,\vec{\alpha}_{n} \right\} 张成的向量空间。

如,由两个不相关的向量使用平行四边形法则可以生成平面上所有的向量。

4.2.2 子空间的几何意义

子空间的定义

{ α 1 , α 2 , , α m } \left\{ \vec{\alpha}_{1},\vec{\alpha}_{2}, \cdots,\vec{\alpha}_{m} \right\} n n 维向量空间 V V 中的一个向量组, m n m\le n ;这个向量组的所有的线性组合生成一个向量空间:
s p a n { α 1 , α 2 , , α m } = { x 1 α 1 + x 2 α 2 + + x m α m x 1 , x 2 , , x m R } {\rm span}\left\{ \vec{\alpha}_{1},\vec{\alpha}_{2}, \cdots,\vec{\alpha}_{m} \right\}=\left\{x_{1} \vec{\alpha}_{1}+x_{2} \vec{\alpha}_{2} +\cdots+x_{m} \vec{\alpha}_{m} | x_{1}, x_{2}, \ldots ,x_{m} \in \mathbb R\right\}
称为由向量 { α 1 , α 2 , , α m } \left\{ \vec{\alpha}_{1},\vec{\alpha}_{2}, \cdots,\vec{\alpha}_{m} \right\} 张成的子空间。

注意, V V 空间和 H H 子空间都要包含 0 \vec 0 ,否则就不能满足加法和数乘的封闭运算。

例如,三维空间中,2个三维的向量,张成了一个平面(向量个数2≤维数3),这个平面就是三维空间的子空间。

n n 维实线性空间 R n \mathbb R^n 的子空间

R n \mathbb R^n 表示所有 n n 维实向量所构成的集合。每个向量中的元素是实数,元素有 n n 个。如 R 2 \mathbb R^2 表示平面实向量集合, R 3 \mathbb R^3 表示三维空间实向量集合。

三维向量空间 R 3 \mathbb R^3 的所有子空间为:

  • 三维子空间:本身 R 3 = s p a n { α 1 , α 2 , α 3 } \mathbb R^3 ={\rm span}\left\{ \vec{\alpha}_{1},\vec{\alpha}_{2},\vec{\alpha}_{3} \right\} ,其中 α 1 , α 2 , α 3 \vec{\alpha}_{1},\vec{\alpha}_{2},\vec{\alpha}_{3} 线性无关,同样表现为一个立体空间(如下图中 V V 所示);
  • 二维子空间:如 R 2 = s p a n { α 1 , α 2 } \mathbb R^2 ={\rm span}\left\{ \vec{\alpha}_{1},\vec{\alpha}_{2}\right\} ,其中 α 1 , α 2 \vec{\alpha}_{1},\vec{\alpha}_{2} 线性无关,表现为通过原点的任意一个平面。注意:二维空间 R 2 \mathbb R^2 是不是 R 3 \mathbb R^3 的子空间(如下图中 H , K H,K 所示);
  • 一维子空间:如 s p a n { α 1 } ,   α 1 0 {\rm span}\left\{ \vec{\alpha}_{1}\right\},\ \vec α_1 \ne \vec 0 ,表现为通过原点的任意一条直线(如下图中 H K H \cap K 所示);
  • 零维子空间:只包含原点 0 \vec 0 向量,只有零空间(如下图中原点所示)。

图4.2.2.1 子空间的几何解释

子空间过原点的几何意义

首先,为了研究方便,所有向量都以原点为起点;

其次,如果一个子空间不过原点,那么可能会出现向量的终点在空间中、起点在空间外的情况。当然,向量的加法和数乘也都跑到子空间外面去了,也就不再对加法和数乘封闭。如下图所示, S S 也就不是二维向量子空间了。


图4.2.2.2 子空间不过原点则不再对加法和数乘封闭

4.2.3 基、维数及其坐标的几何意义

  • 一个基包含的向量个数就是坐标轴的个数,也就是向量空间的维数;
  • 作为基的每一个向量都线性无关,它是一个最大无关向量组
  • 在一个 n n 维的线性空间中,可以取不同的向量组(每个向量组含有 n n 个线性无关的向量)作为基。

4.2.4 基变换的几何意义

在一个 n n 维线性空间 V V 中, α 1 , α 2 , , α n \vec{\alpha}_{1},\vec{\alpha}_{2},\dots,\vec{\alpha}_n β 1 , β 2 , , β n \vec{\beta}_{1},\vec{\beta}_{2},\dots,\vec{\beta}_n V V 的两个基,则由基 α 1 , α 2 , , α n \vec{\alpha}_{1},\vec{\alpha}_{2},\dots,\vec{\alpha}_n 到基 β 1 , β 2 , , β n \vec{\beta}_{1},\vec{\beta}_{2},\dots,\vec{\beta}_n 的变换公式为:
( β 1 β 2 β n ) = ( α 1 α 2 α n ) ( a 11 a 21 a n 1 a 12 a 22 a n 2 a 1 n a 2 n a n n ) \left(\vec{\beta}_{1}\quad\vec{\beta}_{2}\quad \dots \quad \vec{\beta}_n\right)=\left(\vec{\alpha}_{1} \quad \vec{\alpha}_{2}\quad \dots\quad \vec{\alpha}_n\right)\left(\begin{array}{cccc} a_{11} & a_{21} & \ldots & a_{n 1} \\ a_{12} & a_{22} & \ldots & a_{n 2} \\ \vdots & \vdots & \ddots & \vdots \\ a_{1 n} & a_{2 n} & \ldots & a_{n n} \end{array}\right)

( β 1 β 2 β n ) = ( a 11 a 12 a 1 n a 21 a 22 a 2 n a n 1 a n 2 a n n ) ( a 1 a 2 a n ) \left(\begin{array}{cccc} \vec{\beta}_{1} \\ \vec{\beta}_{2} \\ \vdots \\ \vec{\beta}_{\mathbf{n}} \end{array}\right)=\left(\begin{array}{cccc} a_{11} & a_{12} & \ldots & a_{1n} \\ a_{21} & a_{22} & \ldots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{n1} & a_{n2} & \ldots & a_{nn} \end{array}\right)\left(\begin{array}{cccc} \vec{a}_{1} \\ \vec{a}_{2} \\ \vdots \\ \vec{a}_{\mathbf{n}} \end{array}\right)
其中,矩阵 P = ( a 11 a 21 a n 1 a 12 a 22 a n 2 a 1 n a 2 n a n n ) \boldsymbol P = \left(\begin{array}{cccc} a_{11} & a_{21} & \ldots & a_{n 1} \\ a_{12} & a_{22} & \ldots & a_{n 2} \\ \vdots & \vdots & \ddots & \vdots \\ a_{1 n} & a_{2 n} & \ldots & a_{n n} \end{array}\right) P T = ( a 11 a 12 a 1 n a 21 a 22 a 2 n a n 1 a n 2 a n n ) \boldsymbol P ^{\rm T} =\left(\begin{array}{cccc} a_{11} & a_{12} & \ldots & a_{1n} \\ a_{21} & a_{22} & \ldots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{n1} & a_{n2} & \ldots & a_{nn} \end{array}\right) 称为由基 α 1 , α 2 , , α n \vec{\alpha}_{1},\vec{\alpha}_{2},\dots,\vec{\alpha}_n 到基 β 1 , β 2 , , β n \vec{\beta}_{1},\vec{\beta}_{2},\dots,\vec{\beta}_n 的过渡矩阵。 P \boldsymbol P 的列向量和 P T \boldsymbol P^{\rm T} 的行向量分别是 β 1 , β 2 , , β n \vec{\beta}_{1},\vec{\beta}_{2},\dots,\vec{\beta}_n 在基 α 1 , α 2 , , α n \vec{\alpha}_{1},\vec{\alpha}_{2},\dots,\vec{\alpha}_n 上的坐标。

相应地有坐标转换公式:
( x 1 x 2 x n ) = P ( x 1 x 2 x n ) \left(\begin{array}{cccc} x_{1} \\ x_{2} \\ \vdots \\ x_{n} \end{array}\right)=\boldsymbol{P}\left(\begin{array}{cccc} x_{1}' \\ x_{2}' \\ \vdots \\ x_{n}^{\prime} \end{array}\right)

( x 1 x 2 x n ) = P 1 ( x 1 x 2 x n ) \left(\begin{array}{cccc} x_{1}' \\ x_{2}' \\ \vdots \\ x_{n}' \end{array}\right)=\boldsymbol{P}^{-1}\left(\begin{array}{cccc} x_{1} \\ x_{2} \\ \vdots \\ x_{n} \end{array}\right)

4.2.5 标准正交基的几何解释

  • 如果基向量互相垂直,就称为正交基;若再保证每个基向量的长度等于1,那么这个基就称为标准正交基;
  • 二维空间中的标准正交基不止 { ( 0 , 1 ) ,   ( 1 , 0 ) } \{(0,1),\ (1,0)\} 两个,它们在平面坐标系上单位圆上(自由向量全部从原点出发)。

4.2.6 施密特正交化的几何解释

规范正交化

α 1 , α 2 , , α r \vec{\alpha}_{1},\vec{\alpha}_{2},\dots,\vec{α}_r 是向量空间 V V 中任意一个基,现要在这组基上重新构造出一个新基 e ^ 1 , e ^ 2 , e ^ r \hat e_1, \hat e_2, \dots \hat e_r ,这个过程就是正交化。步骤如下:

  1. 正交化(施密特正交化):令
    β 1 = α 1 , β 2 = α 2 β 1 α 2 β 1 β 1 β 1 , β 3 = α 3 β 1 α 3 β 1 β 1 β 1 β 2 α 3 β 2 β 2 β 2 , , β r = α r β 1 α r β 1 β 1 β 1 β 2 α r β 2 β 2 β 2 β r 1 α r β r 1 β r 1 β r 1 \begin{aligned} &\vec \beta_1 = \vec \alpha_1,\\ &\vec \beta_2 = \vec \alpha_2-\dfrac{\vec \beta_1 \cdot \vec \alpha_2}{\vec \beta_1 \cdot \vec \beta_1}\vec \beta_1,\\ &\vec \beta_3 = \vec \alpha_3-\dfrac{\vec \beta_1 \cdot \vec \alpha_3}{\vec \beta_1 \cdot \vec \beta_1}\vec \beta_1-\dfrac{\vec \beta_2 \cdot \vec \alpha_3}{\vec \beta_2 \cdot \vec \beta_2}\vec \beta_2,\\ &\cdots,\\ &\vec \beta_r = \vec \alpha_r-\dfrac{\vec \beta_1 \cdot \vec \alpha_r}{\vec \beta_1 \cdot \vec \beta_1}\vec \beta_1-\dfrac{\vec \beta_2 \cdot \vec \alpha_r}{\vec \beta_2 \cdot \vec \beta_2}\vec \beta_2-\cdots-\dfrac{\vec \beta_{r-1} \cdot \vec \alpha_r}{\vec \beta_{r-1} \cdot \vec \beta_{r-1}}\vec \beta_{r-1} \end{aligned}

  2. 单位化:
    e ^ i = β i β i \hat e_i = \dfrac {\vec \beta_i}{\left|\left|\vec \beta_i\right|\right|}
    其中 i = 1 , 2 , , r i=1,2,\dots,r

求取标准正交基的几何意义

一维空间

{ ( x ) } \{(\vec x)\} 是一个基,显然对其进行单位化就得到了标准正交基: { ( x x ) } \left\{\left(\dfrac {\vec x} {|\vec x|}\right) \right\}

二维空间

{ ( α 1 , α 2 ) } \{(\vec α_1, \vec α_2)\} 是一个基(如图),由其得到标准正交基就是通过向量的伸缩和加减计算把向量 α 1 , α 2 \vec α_1,\vec α_2 变化到单位圆上,得到正交的新向量 e ^ 1 , e ^ 2 \hat e_1,\hat e_2 。方法如下1
β 2 = α 2 [ β 1 , α 2 ] [ β 1 , β 1 ] β 1 = α 2 [ β 1 , α 2 ] β 1 2 β 1 = α 2 [ β 1 β 1 , α 2 ] β 1 β 1 = α 2 [ e ^ 1 , α 2 ] e ^ 1 \begin{aligned} \vec \beta_{2} & =\vec \alpha_{2}-\dfrac{\left[\vec \beta_{1}, \vec \alpha_{2}\right]}{\left[\vec \beta_{1}, \vec \beta_{1}\right]} \vec \beta_{1}\\ &=\vec \alpha_{2}-\frac{\left[\vec{\beta}_{1}, \vec{\alpha}_{2}\right]}{\left|\left|\vec \beta_1\right|\right|^2} \vec{\beta}_{1}\\ &=\vec{\alpha}_{2}-\left[\frac{\vec{\beta}_{1}}{\left|\left|\vec \beta_1\right|\right|}, \vec{\alpha}_{2}\right] \frac{\vec{\beta}_{1}}{\left\|\vec{\beta}_{1}\right\|}\\ &=\vec{\alpha}_{2}-\left[\hat{e}_{1}, \vec{\alpha}_{2}\right] \hat{e}_{1} \end{aligned}
如图, [ e ^ 1 , α 2 ] \left[\hat{e}_{1}, \vec{\alpha}_{2}\right] α 2 \vec α_2 在单位向量 e ^ 1 \hat e_1 上的投影长度(坐标值), α 2 \vec α_2 减去自己在 e ^ 1 \hat e_1 上的投影 [ e ^ 1 , α 2 ] e ^ 1 \left[\hat{e}_{1}, \vec{\alpha}_{2}\right]\hat e_1 ,即得到正交于 e ^ 1 \hat e_1 的向量 β 2 β_2 。再进行正交化,即得到标准正交基。


图4.2.6.1 对二维空间基规范正交化的几何解释
三维空间

类似地有:
β 1 = α 1 β 2 = α 2 [ e ^ 1 , α 2 ] e ^ 1 β 3 = α 3 [ e ^ 1 , α 3 ] e ^ 1 [ e 2 , α 3 ] e 2 \begin{array}{l} \vec{\beta}_{1}=\vec{\alpha}_{1} \\ \vec{\beta}_{2}=\vec{\alpha}_{2}-\left[\hat{e}_{1}, \vec{\alpha}_{2}\right] \hat{e}_{1} \\ \vec{\beta}_{3}=\vec{\alpha}_{3}-\left[\hat{e}_{1}, \vec{\alpha}_{3}\right] \hat{e}_{1}-\left[\vec{e}_{2}, \vec{\alpha}_{3}\right] \vec{e}_{2} \end{array}
前面两个公式是二维空间的公式,已经讨论过。对于新增的第三个公式的几何含义,不难看出: α 3 \vec α_3 减去自己在 e ^ 1 \hat e_1 e ^ 2 \hat e_2 上的投影的向量和,即减去自己上的投在为基的子空间(平面)影,得到 β 3 \vec β_3

由于 α 3 \vec α_3 减去自己在 e ^ 1 \hat e_1 上的投影后必然垂直于 e ^ 1 \hat e_1 ,减去自己在 e ^ 2 \hat e_2 上的投影后必然垂直于 e ^ 2 \hat e_2 ,因而 β 3 \vec β_3 垂直于 { e ^ 1 , e ^ 2 } \left\{\hat e_1,\hat e_2 \right\} 为基的子空间(平面)。


图4.2.6.2 对三维空间基规范正交化的几何解释

第五章 矩阵的几何意义

在线性空间中如果确定了一个基,线性映射就可以用确定的矩阵来表示,这就是矩阵的几何意义:线性空间上的线性映射。

5.1 矩阵的概念

标量是一维向量,向量是标量的数组,矩阵则是向量的数组。

5.2 矩阵加法的几何意义

[ a 11 a 12 a 13 b 11 b 12 b 13 c 11 c 12 c 13 ] + [ a 21 a 22 a 23 b 21 b 22 b 23 c 21 c 22 c 23 ] + [ a 31 a 32 a 33 b 31 b 32 b 33 c 31 c 32 c 33 ] = [ a 1 a 2 a 3 b 1 b 2 b 3 c 1 c 2 c 3 ] \left[\begin{array}{lll} a_{11} & a_{12} & a_{13} \\ b_{11} & b_{12} & b_{13} \\ c_{11} & c_{12} & c_{13} \end{array}\right]+\left[\begin{array}{ccc} a_{21} & a_{22} & a_{23} \\ b_{21} & b_{22} & b_{23} \\ c_{21} & c_{22} & c_{23} \end{array}\right]+\left[\begin{array}{ccc} a_{31} & a_{32} & a_{33} \\ b_{31} & b_{32} & b_{33} \\ c_{31} & c_{32} & c_{33} \end{array}\right]=\left[\begin{array}{ccc} a_{1} & a_{2} & a_{3} \\ b_{1} & b_{2} & b_{3} \\ c_{1} & c_{2} & c_{3} \end{array}\right]

的几何图形为:


图5.2.1 矩阵加法的几何解释

图中显示了三组向量同时连加,每组有三个向量的分量连加。

5.3 矩阵与向量的乘法的几何意义

A x \boldsymbol A \vec x 表现为 A \boldsymbol A 对一个向量 x \vec x 作用的结果。其作用的主要过程是对一个向量进行旋转和缩放的综合过程(即线性变换的过程),一个向量就变换为另外一个向量。一个 m m n n 列的实矩阵 A m × n \boldsymbol A_{m\times n} 就是一个 R n R m \mathbb R^n \rightarrow \mathbb R^m 上的线性变换。

矩阵与单位坐标向量的乘积的几何解释

  • i ^ \hat i 左乘 A \boldsymbol A 就是把矩阵 x x 轴行向量(第一行)取出来;类似地, j ^ \hat j 左乘 A \boldsymbol A 就是把矩阵 y y 轴行向量(第二行)取出来……例如 i ^ A = ( 1   0   0 ) [ a 1 a 2 a 3 b 1 b 2 b 3 c 1 c 2 c 3 ] = ( a 1   a 2   a 3 ) \hat{i} \boldsymbol{A}=(1\ 0\ 0)\left[\begin{array}{lll} a_{1} & a_{2} & a_{3} \\ b_{1} & b_{2} & b_{3} \\ c_{1} & c_{2} & c_{3} \end{array}\right]=\left(a_{1}\ a_{2}\ a_{3}\right)

  • i ^ \hat i 右乘 A \boldsymbol A 就是把矩阵 x x 轴列向量(第一列)取出来;类似地, j ^ \hat j 右乘 A \boldsymbol A 就是把矩阵 y y 轴列向量(第二列)取出来……例如 A i ^ T = [ a 1 a 2 a 3 b 1 b 2 b 3 c 1 c 2 c 3 ] ( 1 0 0 ) = ( a 1 b 1 c 1 ) \boldsymbol{A} \hat{i}^{\rm T} =\left[\begin{array}{lll} a_{1} & a_{2} & a_{3} \\ b_{1} & b_{2} & b_{3} \\ c_{1} & c_{2} & c_{3} \end{array}\right]\left(\begin{array}{l} 1 \\ 0 \\ 0 \end{array}\right)=\left(\begin{array}{l} a_{1} \\ b_{1} \\ c_{1} \end{array}\right)

这种将一行(一列)取出的操作实质上就是把对应左乘(右乘)的单位向量做缩放旋转变换。

矩阵与任意向量的乘积的几何解释

A d = [ a 1 a 2 a 3 b 1 b 2 b 3 c 1 c 2 c 3 ] ( d 1 d 2 d 3 ) = [ a 1 a 2 a 3 b 1 b 2 b 3 c 1 c 2 c 3 ] ( d 1 ( 1 0 0 ) + d 2 ( 0 1 0 ) + d 3 ( 0 0 1 ) ) = d 1 ( a 1 b 1 c 1 ) + d 2 ( a 2 b 2 c 2 ) + d 3 ( a 3 b 3 c 3 ) \begin{aligned} \boldsymbol A\vec d &=\left[\begin{array}{lll} a_{1} & a_{2} & a_{3} \\ b_{1} & b_{2} & b_{3} \\ c_{1} & c_{2} & c_{3} \end{array}\right]\left(\begin{array}{l} d_{1} \\ d_{2} \\ d_{3} \end{array}\right)\\ &=\left[\begin{array}{lll} a_{1} & a_{2} & a_{3} \\ b_{1} & b_{2} & b_{3} \\ c_{1} & c_{2} & c_{3} \end{array}\right]\left(d_{1}\left(\begin{array}{l} 1 \\ 0 \\ 0 \end{array}\right)+d_{2}\left(\begin{array}{l} 0 \\ 1 \\ 0 \end{array}\right)+d_{3}\left(\begin{array}{l} 0 \\ 0 \\ 1 \end{array}\right) \right)\\ & = d_{1}\left(\begin{array}{l} a_{1} \\ b_{1} \\ c_{1} \end{array}\right)+d_{2}\left(\begin{array}{l} a_{2} \\ b_{2} \\ c_{2} \end{array}\right)+d_{3} \left(\begin{array}{l} a_{3} \\ b_{3} \\ c_{3} \end{array}\right) \end{aligned}

矩阵 A \boldsymbol A 对任意向量 d \vec d 的乘积可以分为以下过程:

  • A \boldsymbol A 分别对单位向量 i ^ , j ^ , k ^ \hat i, \hat j,\hat k 进行伸缩旋转变换,得到三个列向量 A i ^ T , A j ^ T , A k ^ T \boldsymbol A \hat i^{\rm T},\boldsymbol A \hat j^{\rm T},\boldsymbol A \hat k^{\rm T}
  • 对其进行伸缩变换,得到 d 1 A i ^ T , d 2 A j ^ T , d 3 A k ^ T d_1\boldsymbol A \hat i^{\rm T},d_2\boldsymbol A \hat j^{\rm T},d_3\boldsymbol A \hat k^{\rm T}
  • 相加,即为 A d \boldsymbol A\vec d

图5.3.1 矩阵与任意向量的乘积的几何解释

如图,将三个黑色向量相加,即得到 A d = ( a 1 d 1 + a 2 d 2 + a 3 d 3 b 1 d 1 + b 2 d 2 + b 3 d 3 c 1 d 1 + c 2 d 2 + c 3 d 3 ) \boldsymbol A\vec d =\left(a_{1} d_{1}+a_{2} d_{2}+a_{3} d_{3}\quad b_{1} d_{1}+b_{2} d_{2}+b_{3} d_{3}\quad c_{1} d_{1}+c_{2} d_{2}+c_{3} d_{3}\right)

也就是说, A \boldsymbol A 的列向量分别进行伸缩变换后相加,得到的新向量即为 A d \boldsymbol A\vec d

旋转矩阵对向量的乘积的几何解释

二阶旋转矩阵 A \boldsymbol A
A = ( cos θ sin θ sin θ cos θ ) \boldsymbol A =\left(\begin{array}{cc} \cos \theta & -\sin \theta \\ \sin \theta & \cos \theta \end{array}\right)
而旋转矩阵的列向量就是 i ^ , j ^ \hat i,\hat j 逆时针旋转 θ θ 后得到的坐标。

5.4 矩阵与矩阵的乘法几何意义

矩阵与矩阵的乘法的意义


A c = [ a 1 a 2 b 1 b 2 ] ( c 1 c 2 ) , A d = [ a 1 a 2 b 1 b 2 ] ( d 1 d 2 ) \boldsymbol A\vec c=\left[\begin{array}{ll} a_{1} & a_{2} \\ b_{1} & b_{2} \end{array}\right]\left(\begin{array}{l} c_{1} \\ c_{2} \end{array}\right),\quad \boldsymbol A\vec d=\left[\begin{array}{ll} a_{1} & a_{2} \\ b_{1} & b_{2} \end{array}\right]\left(\begin{array}{l} d_{1} \\ d_{2} \end{array}\right)

C = A B = A ( c   d ) = [ a 1 a 2 b 1 b 2 ] [ c 1 d 1 c 2 d 2 ] \boldsymbol C = \boldsymbol A\boldsymbol B=\boldsymbol A\left(\vec c \ \vec d\right)=\left[\begin{array}{ll} a_{1} & a_{2} \\ b_{1} & b_{2} \end{array}\right]\left[\begin{array}{ll} c_{1} & d_{1} \\ c_{2} & d_{2} \end{array}\right]
其几何意义为:

  • 把其中一个矩阵(如 B \boldsymbol B )看作动作矩阵,将另一个矩阵(如 A \boldsymbol A )看作被动作矩阵。动作矩阵作用于被动作矩阵,将其行向量(或列向量)构成的几何图形进行旋转、缩放、镜像等线性变换,得到新的行(列)向量,并组成一个新的矩阵 C \boldsymbol C 。也就是说:动作矩阵对被动作矩阵对应的的几何图形进行了线性变换(如图5.4.1所示,绿色几何图形变换为橙色图形);
  • 两个矩阵都被看作是作用矩阵,两个矩阵的乘积被看作是两个矩阵的和作用。

图5.4.1 矩阵与矩阵乘法的几何解释

矩阵左乘与右乘的不同

矩阵乘法不满足交换律,但是以下情况满足:

  • A I = I A = A \boldsymbol A\boldsymbol I=\boldsymbol I\boldsymbol A=\boldsymbol A
  • A A 1 = A 1 A = I \boldsymbol A\boldsymbol A^{-1}=\boldsymbol A^{-1}\boldsymbol A=\boldsymbol I

5.5 矩阵与线性变换的关系的几何意义

矩阵与线性变换的关系

定理:设 T :   R 2 R 2 T:\ \mathbb R^2 \rightarrow \mathbb R^2 是任意一个线性变换,那么 T T 矩阵的列向量为 T ( e ^ 1 ) T\left(\hat e_1\right) T ( e ^ 2 ) T\left(\hat e_2\right) 。对于二阶和三阶情形,将此定理反向使用,也可以快速领会其对应的几何意义上的线性变换。

例如,设 T :   R 2 R 2 T:\ \mathbb R^2 \rightarrow \mathbb R^2 是把向量空间 R 2 \mathbb R^2 中的每个向量对于直线 x 2 = x 1 x_2=-x_1 作反射变换。那么 T ( e ^ 1 ) = T ( i ^ ) = [ 0 1 ] ,   T ( e ^ 2 ) = T ( j ^ ) = [ 1 0 ] T\left(\hat e_1\right)=T\left(\hat i\right)=\begin{bmatrix} 0\\-1\end{bmatrix},\ T\left(\hat e_2\right)=T\left(\hat j\right)=\begin{bmatrix} -1\\0\end{bmatrix} ,故镜像变换矩阵 T = [ 0 1 1 0 ] T=\begin{bmatrix} 0&-1\\-1&0\end{bmatrix}

基本初等矩阵**/**初等行变换的几何意义

数域 R \mathbb R 上的矩阵的基本初等行变换有3种:

  • 交换某两行的位置;
  • 把某一行乘以一个非零数 k   ( k R ) k\ (k\in \mathbb R)
  • 把某一行的 k   ( k R ) k\ (k\in \mathbb R) 倍加到另一行上。

一个单位矩阵分别实施上面3种基本初等行变换,所得矩阵分别称为基本初等矩阵(1)、(2)、(3):

  • 基本初等矩阵(1)为 [ 0 1 1 0 ] \begin{bmatrix} 0&1\\1&0\end{bmatrix} ,其几何意义是:关于某一“标准轴(面)”的镜像反射变换,其中标准轴指 x 2 = x 1 x_2=x_1 ,标准面指 x 2 = x 1 , x 2 = x 3 x_2=x_1,x_2=x_3 x 3 = x 1 x_3=x_1
  • 基本初等矩阵(2)为 [ k 0 0 1 ] \begin{bmatrix} k&0\\0&1\end{bmatrix} (或 [ 1 0 0 k ] \begin{bmatrix} 1&0\\0&k\end{bmatrix} ),其几何意义是:在 x 1 x_1 (或 x 2 x_2 )方向伸缩 k k 倍,另一个方向上不变;
  • 基本初等矩阵(3)为 [ 1 k 0 1 ] \begin{bmatrix} 1&k\\0&1\end{bmatrix} (或 [ 1 0 k 1 ] \begin{bmatrix} 1&0\\k&1\end{bmatrix} ),其几何意义是:在某一坐标轴方向的切变变换(如图所示)。

图5.5.1 基本初等矩阵(3)的几何解释

5.6 矩阵乘法运算律的几何意义

  • 两个矩阵相乘是两个线性变换的复合。例如, A = [ 1 0 0 1 ] \boldsymbol A = \begin{bmatrix} 1&0\\0&-1\end{bmatrix} 表示实施关于 x 1 x_1 轴的反射变换, B = [ 0 1 1 0 ] \boldsymbol B= \begin{bmatrix} 0&1\\1&0\end{bmatrix} 表示实施关于 x 2 = x 1 x_2=x_1 的反射变换,则 A B = [ 0 1 1 0 ] \boldsymbol AB = \begin{bmatrix} 0&-1\\1&0\end{bmatrix} 表示两项操作的复合效果:逆时针旋转90°。

  1. a b [ a , b ] \vec a \cdot \vec b \Leftrightarrow \left[ \vec a , \vec b\right] ↩︎

发布了11 篇原创文章 · 获赞 1 · 访问量 1241

猜你喜欢

转载自blog.csdn.net/szzheng/article/details/104520351
今日推荐