笔记:宾大《Algebra, Topology, Differential Calculus, and Optimization Theory For CS and ML》——第三章第五节

3.5 向量空间的基(bases)

在上一节中我们可以了解到,在一个向量空间 E E 中,任何一个其内的线性组合以及零向量的子空间都可以视为向量空间 E E 的子空间,所以我们可以使用这些线性组合来表示整个向量空间 E E ,但是这样会产生较大的冗余,而如何使用较少的、有效的向量表达整个向量空间就是一个亟待解决的问题。这里我们定义向量空间的基(base)这一定义。

定义 对于一个向量空间 E E 以及它的子集 V V ,带有索引的集合 ( v i ) i I (v_i)_{i \in I} 对应于空间 V V 、向量 v i V v_i \in V 以及 V V 的线性组合等。对于每一个 v V v \in V , 这里有一些标量的带索引的集合 ( λ i ) i I K (\lambda_i)_{i\in I} \in K ,存在
v = i I λ i v i v= \sum_{i\in I}\lambda_i v_i
如果集合 ( v i ) i I (v_i)_{i \in I} 是线性独立的,那么我们称其为向量空间 V V 下的一组(basis)。同时如果 E E 的子集 V V 可以使用有限的 ( v i ) i I (v_i)_{i \in I} 生成,那么我们称向量空间 V V 是可有限生成的(finitely generated)。

例子:

  1. R 3 \R^3 中,向量 ( 1 , 0 , 0 ) , ( 0 , 1 , 0 ) , ( 0 , 0 , 1 ) (1,0,0),(0,1,0),(0,0,1) 就是此空间下的一组基。

  2. R 4 \R^4 中,向量 ( 1 , 1 , 1 , 1 ) , ( 1 , 1 , 1 , 1 ) , ( 1 , 1 , 0 , 0 ) , ( 0 , 0 , 1 , 1 ) (1,1,1,1),(1,1,-1,-1),(1,-1,0,0),(0,0,1,-1) 是此空间下的一组基,我们称之为 Haar basis (哈尔基) ,在小波理论中,Haar basis及其推广到 2 n 2^n 的维数是至关重要的。

  3. 在最高次幂为 n n 的多项式 R [ X ] \R[X] 的子空间内,是 1 , X , X 2 , , X n 1,X,X^2,…,X^n 它的基。

  4. Bernstein polynomial(伯恩斯坦多项式)是定义空间内的一组基,其表达形式为 ( n k ) ( 1 X ) n k X k \left ( \begin{matrix} n\\k \end{matrix} \right )(1-X)^{n-k}X^k ,其中 k = 0 , , n k=0,…,n ,这个多项式在样条曲线(spline curves)理论中起着重要作用 。

当然,每一个向量空间都有基,这也是线性代数的基石。下面我们从一个重要的引理开始,它形式化了逐步构建基的机制。

引理 对于给定向量空间的线性无关集 ( u i ) i I (u_i)_{i \in I} ,如果 v E v \in E 不是 ( u i ) i I (u_i)_{i \in I} 的线性组合,那么可以通过将 v v 添加到 ( u i ) i I (u_i)_{i \in I} 中可以得到一组线性独立集合,即 ( u i ) i I k ( v ) (u_i)_{i \in I} \cap_k (v) ( k I k \notin I )。

定理 对于任何的有限集合 S = ( u i ) i I S = (u_i)_{i \in I} 生成的向量空间 E E 以及任意的线性独立的子集 L = ( u i ) j J L = (u_i)_{j \in J} (这里 J I J \subseteq I ) ,那么对于 E E 的基 B B 存在 L B S L \subseteq B \subseteq S

当然,上面这个定理同样适用于非有限生成的向量空间,在这种情况下,要首先保证存在一个足够大的线性无关集合 B B ,也让其满足条件 L B S L \subseteq B \subseteq S 。这个足够大的线性无关集合可以找到,在Zorn’s lemma中有证明方法。

基的定义同样可以使用极大线性无关组和极小生成组来定义。

定义 我们令 ( v i ) i I (v_i)_{i \in I} 是向量空间 E E 中的一个向量组,当 ( v i ) i I (v_i)_{i \in I} 是线性独立时,我们说 ( v i ) i I (v_i)_{i \in I} 是向量空间 E E 的一个极大线性无关组(maximal linearly independent family)。如果对于任意的向量 w E w \in E ,向量组 ( v i ) i I k ( w ) (v_i)_{i \in I} \cap_k (w) 是线性相关的。如果对于每一个索引 p I p \in I 集合 ( v i ) i I { p } (v_i)_{i \in I-\{p\}} 由去除不属于 E E 的向量集 ( v i ) i I (v_i)_{i \in I} 组成,那么我们说 ( v i ) i I (v_i)_{i \in I} 是向量空间 E E 中的极小生成集(minimal generating family) 。

命题 对于向量空间 E E ,对于每一个在 E E 中的集合 B = ( v i ) i I B = (v_i)_{i \in I} ,一下的性质是等价的:

  • B B E E 的一组基
  • B B E E 的极大线性无关组(maximal linearly independent family)
  • B B E E 的极小生成组(minimal generating family)

另外地,线性代数的关键结果是,对于向量空间 E E 的任意两个基 ( u i ) i I (u_i)_{i \in I} ( v j ) j J (v_j)_{j \in J} ,索引集 I I J J 有相同的基数。特别地,如果 E E 有一个有限的 n n 次的基,每一个 E E 的基都有 n n 个元素,每一个整数 n n 都是称为向量空间 E E 维度(dimension)。

命题 替换引理 给定一个向量空间 E E ,令 ( u 1 , u m ) (u_1,…u_m) E E 内的任意有限的线性无关集,并令 ( v 1 , , v n ) (v_1,…,v_n) 为任意的有限簇,并且使每一个 u i u_i 都是 ( v 1 , , v n ) (v_1,…,v_n) 的线性组合。在这里,我们必须有 n m n \ge m , 而且使用 ( u 1 , , u m ) (u_1,…,u_m) 替代 v j v_j ,在重新命名了这些索引 v j s v_js 后,向量集 ( u 1 , u m , v m + 1 , , v n ) (u_1,…u_m,v_{m+1},…,v_n) ( v 1 , v n ) (v_1,…v_n) 可以生成相同的 E E 的子空间。

下面是一些说明替换引理的例子:

对于一个序列 ( u 1 , u 2 , u 3 ) (u_1,u_2,u_3) ( v 1 , v 2 , v 3 , v 4 , v 5 ) (v_1,v_2,v_3,v_4,v_5) ,其中 ( u 1 , u 2 , u 3 ) (u_1,u_2,u_3) 是一个线性独立集,并 u i s u_is 可以用 v j s v_js 代替为下列形式:
u 1 = v 4 + v 5 u 2 = v 3 + v 4 v 5 u 3 = v 1 + v 2 + v 3 u_1=v_4+v_5\\ u_2 = v_3+v_4-v_5\\ u_3 = v_1+v_2+v_3
从第一个等式有
v 4 = u 1 v 5 v_4 = u_1-v_5
将上式带入第二个等式有
u 2 = v 3 + v 4 v 5 = v 3 + u 1 v 5 v 5 = u 1 + v 3 2 v 5 u_2= v_3+v_4-v_5=v_3+u_1-v_5-v_5=u_1+v_3-2v_5
从上面的表达式我们可以得到
v 3 = u 1 + u 2 + 2 v 5 v_3= -u_1+u_2+2v_5
所以有
u 3 = v 1 + v 2 + v 3 = v 1 + v 2 u 1 + u 2 + 2 v 5 u_3= v_1+v_2+v_3=v_1+v_2-u_1+u_2+2v_5
所以最后我们有
v 1 = u 1 u 2 + u 3 v 2 2 v 5 v 3 = u 1 + u 2 + 2 v 5 v 4 = u 1 v 5 v_1=u_1-u_2+u_3-v_2-2v_5\\ v_3= -u_1+u_2+2v_5\\ v_4 = u_1-v_5
从上面这个例子可以看出, ( u 1 , u 2 , u 3 , v 2 , v 5 ) (u_1,u_2,u_3,v_2,v_5) 拥有和 ( v 1 , v 2 , v 3 , v 4 , v 5 ) (v_1,v_2,v_3,v_4,v_5) 相同的子空间。即向量 ( v 1 , v 3 , v 4 ) (v_1,v_3,v_4) 可以被 ( u 1 , u 2 , u 3 ) (u_1,u_2,u_3) 所替代,剩下的两个向量为 ( v 2 , v 5 ) (v_2,v_5) ,我们可以将其重新命名为 ( v 4 , v 5 ) (v_4,v_5)

为了完整性,下面给出一个对于替换定理更加正式的定义(声明):

替换定理2: 对于一个向量空间 E E ,令 ( u i ) i I (u_i)_{i \in I} E E 的任意的有限的线性独立集,其中 I = m |I| = m ,同时令 ( v j ) j J (v_j)_{j \in J} 是一个有限集,并且每一个 u i u_i 都是 ( v j ) j J (v_j)_{j \in J} 的线性组合,其中 J = n |J| = n 。那么存在一个集合 L L 以及一个映射关系 ρ : L J \rho:L \rarr J (一个重新标记函数) ,存在 L I = L \cap I= \emptyset L = n m |L|=n-m ,那么集合 ( u i ) i I ( v ρ ( l ) ) l L (u_i)_{i \in I} \cup (v_{\rho(l)})_{l \in L} 和集合 ( v j ) j J (v_j)_{j \in J} 可以生成相同的 E E 的子空间,当然 n m n \ge m

实际上,当向量空间是用有限的向量生成时,上面的命题就包含了上面的定理,如果我们将两者结合起来,我们可以得到下面的基本定理(普适的)

定理 E E 为有限向量生成的向量空间。对于任意的生成 E E 的集合 ( u i ) i I (u_i)_{i \in I} 都包括了一个子集 ( u j ) j J (u_j)_{j \in J} ,其就是向量空间 E E 的基。对于任何线性独立的集合 ( u i ) i I (u_i)_{i \in I} 可以扩展为 ( u j ) j J (u_j)_{j \in J} I J I \subseteq J )。更进一步,对于每两个向量空间 E E 的基 ( u i ) i I (u_i)_{i \in I} ( u j ) j J (u_j)_{j \in J} ,对于每一个固定的整数 n 0 n \ge0 ,我们都有 I = J = n |I| = |J| = n

上面的定理同样也适用于非有限向量生成的向量空间。

定义 当一个向量空间不是由有限的向量所能生成的,我们说它是无限维的。有限生成的向量空间的(dimension)是其所有基的共同维数,用 d i m ( E ) dim(E) 表示。

显然的,如果 K K 可以看作为一个向量空间,且每一个满足 a K a \in K 以及 a 0 a \ne 0 ( a ) (a) 都可以看为一组基 。那么其维度为1。

注意: d i m ( { 0 } ) = 0 dim(\{0\}) = 0

定义 如果 E E 是一个维度 n 1 n \ge 1 的向量空间,对于 E E 的任意子集 U U ,如果存在 d i m ( U ) = 1 dim(U) =1 ,那么称 U U 线(line) ;同样,如果 d i m ( U ) = 2 dim(U) =2 ,那么称 U U 平面(plane) ;如果 d i m ( U ) = n 1 dim(U) =n-1 ,那么 U U 超平面(hyperplane) ;特别地,如果 d i m ( U ) = k dim(U) =k ,那么我们将 U U 称为 k-plane

如果 ( u i ) i I (u_i)_{i \in I} 为向量空间 E E 的一组基,对于任意的向量 v E v \in E ,由于向量集 ( u i ) i I (u_i)_{i \in I} 可以构成向量空间 E E 中的任何一个向量,这样可以用一组标量组 ( λ i ) i I (\lambda_i)_{i \in I} 表示向量 v v ,即
v = i I λ i u i v=\sum_{i \in I} \lambda_iu_i
注意对于确定的基和确定的向量,标量组 ( λ i ) i I (\lambda_i)_{i \in I} 是唯一的。所以我们可以直接得到下面这个结论:

对于给定的向量空间 E E , ( u i ) i I (u_i)_{i \in I} E E 中的一个向量集,令向量 v E v \in E 并假设 v = i I λ i u i v=\sum_{i \in I} \lambda_iu_i 。当且仅当 ( u i ) i I (u_i)_{i \in I} 线性独立时, 使得 v = i I λ i u i v=\sum_{i \in I} \lambda_iu_i 满足的标量组 ( λ i ) i I (\lambda_i)_{i \in I} 是唯一的。

定义 如果 ( u i ) i I (u_i)_{i \in I} 是向量空间 E E 的一组基,对于任意的向量 v E v \in E ,如果 ( x i ) i I (x_i)_{i\in I} 唯一的标量组,使得
v = i I x i u i v = \sum_{i \in I} x_iu_i
每一个 x i x_i 被叫做基于基 ( u i ) i I (u_i)_{i \in I} 的索引 i i 分量(component)或坐标(coordinate)。

定义 给定的一个空间 K K 和一些非空子集 I I ,令 K ( I ) K^{(I)} 为包含有标量集 ( λ i ) i I (\lambda_i)_{i \in I} 定义下有限支撑的笛卡尔积(cartesian product) K I K^I 的子集,在此我们可以定义加法和乘法如下:
λ i ) i I + ( μ i ) i I = λ i + μ i ) i I (\lambda_i)_{i \in I} + (\mu_i)_{i \in I }=(\lambda_i+\mu_i)_{i \in I}

λ ( μ i ) i I = ( λ μ i ) i I \lambda \cdot(\mu_i)_{i \in I} = (\lambda\mu_i)_{i \in I}

Note:当 I I 是一个有限集合, K ( I ) = K I K^{(I)} = K^I ,但是当 I I 为无限的集合时。实际上, d i m ( K ( I ) ) = I dim(K^{(I)})=|I| ,但是 d i m ( K I ) dim(K^I) 是严格大于当 I I 为有限时的维数的。

预告

矩阵

猜你喜欢

转载自blog.csdn.net/qq_39867051/article/details/106584384