线性空间一些基本性质的证明

线性代数里面蕴含着丰富的数形结合思想,结合图形来理解,难度会小很多,以下证明不一定严密,但至少不依赖任何技巧的花哨的数学方法,依赖空间直觉得出自然而然的结论,学习线性空间理论,应该低起点,高观点。

0.0结合律的证明,同济教材只给出了结论,并没有证明.

矩阵:

ABC=(AB)C=A(BC)

A为一m \times n矩阵,B为一n\times r矩阵,C为一r\times s矩阵,令

D=AB

E=BC

则,需要证明DC=AE,根据矩阵的乘法定义:

d_{il}=\sum_{k=1}^{n}a_{ik}b_{kl}

e_{kj}=\sum_{l=1}^{r}b_{kl}c_{lj}

DC 的 (i,j)元为:

\sum_{l=1}^{r}d_{il}c_{lj}=\sum_{l=1}^{r}(\sum_{k=1}^{n}a_{ik}b_{kl})c_{lj}

AE(i,j)元为:

\sum_{k=1}^{n}a_{ik}e_{kj}=\sum_{k=1}^{n}a_{ik}(\sum_{l=1}^{r}b_{kl}c_{lj})

由于

\sum_{l=1}^{r}d_{il}c_{lj}=\sum_{l=1}^{r}(\sum_{k=1}^{n}a_{ik}b_{kl})c_{lj}=\sum_{l=1}^{r}(\sum_{k=1}^{n}a_{ik}b_{kl}c_{lj})=\sum_{k=1}^{n}a_{ik}(\sum_{l=1}^{r}b_{kl}c_{lj})

所以:

(AB)C=A(BC)

QED!

0.1AA为一n \times n矩阵,则

    \left | A^T\right| = \left | A\right |

  很普通的定理,还是要证一下:

采用数学归纳法证明对于n阶矩阵是成立的,显然,因为1\times 1阶矩阵是对称的标量,结论对于n=1是成立的,假设这个结论对于所有的k \times k也是成立的,则,对于 (k+1)\times (k+1)阶矩阵A,将\left |A \right|按照A的

第一行展开,有:

 \\det(A)=a_{11}det(M_{11}) - a_{12}det(M_{12}) + -\cdots\pm a_{1,k+1}det(M_{1,k+1})

M_{ij}k\times k矩阵,由归纳假设得

\\det(A)=a_{11}det(M^T_{11}) - a_{12}det(M^T_{12}) + -\cdots\pm a_{1,k+1}det(M^T_{1,k+1})

恰好是det(A^T)按照A^T的第一列代数余子式展开,因此

\left | A^T\right| = \left | A\right |

QED!

1.在线性空间的理论中,有一个定理起着重要的作用,描述如下,如果向量组

中每一个向量都是向量组

    

的线性组合,而且m>k,则向量

必定线性相关.

证明过程如下,由题设:

必然存在KxK的满秩矩阵A,使得

空间向量的线性变换结果,也即是:

  

这样

和 均可以做为K维空间的基.

所以,也必然存在逆变换B,使得

其中

A,B互逆.

也就是说,不但x向量可以由y表示,而且也可以反过来标识y向量,两者在空间中是等价的,只是观察角度不同(玩儿游戏的同学应该能懂,吃鸡报点:))

所以,在K维空间中,哪怕在多一个向量,必定可以由k维的基标识,所以

m>k的情况下,多出来的m-k个向量必然可以被表示出来。

证毕:

对于上面证明用到的一个引理,就是为什么要求A矩阵一定满秩,简单证明如下:

 其中

线性无关,其余向量可由其标识:

            

所以:

则x 必然也线性相关,引理得证明。

QED!

人类只能理解三维以下的空间,高维空间到底是什么样子的呢? 好想知道

2.关于空间中的坐标变换:

 将z=4x+5y通过坐标变换变成简单形式。

   首先可以选择平面上的两个点:

  比如(1,1,9)以及(2,1,13)

首先,将两个向量施密特正交化:

施密特正交化后得到:

我们主要关心方向:

将向量规范化为:

则:

所以,

去掉误差项0.0003以及0.0002后,消失了两个维度,得到简化的平面方程

    

空间变换是一种很重要的数据处理思想,一些看似杂乱的数据,如果换一个角度去看,在高纬度的可能存在规律的形状, 要仔细领会。

3.线性空间中有一个非常基础的论断,就是矩阵中行秩必定等于列秩,而且课本给出了证明。

   看似简单,但行秩为什么必须等于列秩呢? 它究竟反应的是空间的什么结构性质呢?

  对于矩阵来说,行秩=列秩,等价于说,如果行线性相关,那么列必定也线性相关,行和列不是一回事呀,包含的元素也不相同,为什么呢? 先通过一个三维空间中的例子来验证这个结论:

如下矩阵,很明显,前两行具有完全的自由度,不会线性相关,第三行由前两行线性组合而成,所以行向量必定线性相关。

列向量是否线性相关,完全看不出任何规律,不明显,我们需要变化一下:

所以,看一看出来,转置矩阵,经过初等行变换后,最后一行简化为0,对应的原来矩阵列线性相关。

所以,原来矩阵 行线性相关<=====>矩阵列线性相关,两个等价。

上面的初等行变换过程是:

所以,行线性相关得证:

或者

让x3为自由变量:

所有由此可见,行向量线性相关必定导致有列向量标识的方程组有非零解,所有列向量也必然线性相关。

相关性和线性方程组之间的关系很微妙,如果行向量线性相关,则必定可以通过行变换消去一个方程,消去方程会导致自由变量多一个,则剩余的方程必定有非零解,有非零解同时也意味着列向量必定线性相关。。。

对于通用情况:

 设以下mxn矩阵,其中m<n。

   

将其写成列向量的格式:

   

假设其列秩为c,则必定存在c个列向量线性无关.我们将其挑选出来做成新的矩阵

其中

   (j<n)

则原矩阵

必定可以写成

线性组合的形式:

同时,也可以写成B矩阵行向量线性组合的形式:

其中


另一种证明:

考虑m \times n矩阵,

$A_{m\times n}=\left [ a_{ij}\right ]= \begin{bmatrix} a_{11}& a_{12}& \cdots & a_{1n}\\ a_{21}& a_{22}& \cdots & a_{2n}\\ \vdots & \vdots & \ddots & \vdots \\ a_{m1}& a_{m2}& \cdots & a_{mn} \end{bmatrix}$

A为一m \times n阶矩阵,设它的行秩为r,列秩为c.

考虑一下A\vec{x}=\vec{0} 的解空间,则A的行阶梯型U将有c个首1元素行,必定有n-c个自由变量,所以A的解空间的维数必为n-c.

另外,考虑到

\\ a_{11}x_1 + a_{12}x_2 + \cdots + a_{1n}x_n = 0 \\ a_{21}x_1 + a_{22}x_2 + \cdots + a_{2n}x_n = 0 \\ \vdots \\ a_{n1}x_1 + a_{n2}x_2 + \cdots + a_{nn}x_n = 0

所以

\vec{x}\vec{a_{1j}}^T是互为正交补空间,\vec{x}的秩为n-r

所以

n-r = n-c=>r=c

QED!


初中时老师告诉我们,有n个方程才能唯一确定n个未知数,所以才叫"方“程,可是现在我们知道了,光有n个方程还不够,这些方程必须是”干货“方程才行。

4.矩阵线性组合的把戏:

                           

以上说明,如果现行线性相关的航向量作为最后一行参与列扩张,扩张成的列向量,满足同样的行扩张系数。

5.最小二乘法的矩阵形式推导:

设:

 \\ R(A)=\{ A\vec{x}|\vec{x}\in R^{n}\},\quad A\in R^{n \times n}\\

 最小二乘问题的矩阵形式:

 求得向量\vec{x},使得A\vec{x}\vec{b}的距离最小,翻译成数学表达就是:

 \\ \exists \vec{b},求\vec{x},使得||A\vec{x}-\vec{b}||_2  最小,2-范数表示的是向量长度,计算方法是向量各个元素的平方和再开方,求它最小值,等价于求:

{||A\vec{x}-\vec{b}||_2}^2的最小值,而:

\\{||A\vec{x}-\vec{b}||_2}^2=(A\vec{x}-\vec{b})^T(A\vec{x}-\vec{b})=(\vec{x}^TA^T-{\vec{b}}^T)(A\vec{x}-\vec{b})\\ =\vec{x}^TA^TA\vec{x}-\vec{x}^TA^T\vec{b}-{\vec{b}}^TA\vec{x}+{\vec{b}}^T{\vec{b}}

根据矩阵微分公式:

\\ \frac{\partial {\vec{x}^T}\vec{a}}{\partial \vec{x}}=\frac{\partial {\vec{a}^T}\vec{x}}{\partial \vec{x}}=\vec{a}\\ \frac{\partial {\vec{x}^T}A\vec{x}}{\partial \vec{x}}=A\vec{x}+A^T\vec{x}

所以:

\\ \frac{\partial {||A\vec{x}-\vec{b}||_2}^2}{\partial \vec{x}}=2A^TA\vec{x}-2A^T\vec{b}=\vec{0}\\ 2A^TA\vec{x}=2A^T\vec{b}=>\vec{x}=(A^TA)^{-1}A^T\vec{b}

所以,最终得到:

\vec{x}=(A^TA)^{-1}A^T\vec{b}

对于方阵来说,它和

A\vec{x}=\vec{b}

同解

QED!

数形结合的方法不一定到处可用,经济学中的数学模型通常有上千个变量,比如说

x_1,x_2,x_3,\cdots ,x_{5000}

这样就意味着必须在R^{5000}中工作,这样的空间不能通过几何手段来处理,但是代数方法却可以很好的发挥作用,因此这门学科叫做线性代数。

6.\{(x_1, x_2, x_3) \in F^3: x_1=5x_3\}是不是F^3上的子空间.

  1.显然 \{0, 0, 0\},满足0=5*0,所以存在加法单位元

  2.\{x,y,z\}, \{a, b, c\} \in F^3,则x=5z, a=5c=>x+a=5(z+c)

     所以(x+a, y+b, z+c)\in F^3,满足加法封闭性.

   3.\{x,y,z\} \in F^3x=5z=>\lambda x=\lambda5z=>\lambda x=5\lambda z=>\{\lambda x, \lambda y, \lambda z\}\in F^3

满足标量乘法的封闭。

所以,是子空间

空间图形如下图所示:

z=\frac{x}{5}

是个过原点的二维空间。

可以想象,不过原点的二维空间是什么样子的?在这个空间中的生物,可能走一小步,就跳出了这个空间,

7:设

v_1, v_2, v_3, v_4

张成V,证明组

 v_1-v_2, v_2-v_3, v_3-v_4, v_4

也张成V

span(V)=\lambda_1v_1+\lambda_2v_2+\lambda_3v_3+\lambda_4v_4 \quad \lambda_1, \lambda_2, \lambda_3, \lambda_4 \in R

[v_1-v_2, v_2-v_3, v_3-v_4, v_4]=[v_1, v_2,v_3, v_4]\begin{bmatrix} 1 & 0 & 0 & 0\\ -1& 1 & 0& 0\\ 0 & -1& 1& 0\\ 0 & 0 & -1& 1 \end{bmatrix}

Rank(\begin{bmatrix} 1 & 0 & 0 & 0\\ -1& 1 & 0& 0\\ 0 & -1& 1& 0\\ 0 & 0 & -1& 1 \end{bmatrix})=4

满秩,所以存在逆矩阵,所以

[v_1, v_2,v_3, v_4]=[v_1-v_2, v_2-v_3, v_3-v_4, v_4]\begin{bmatrix} 1 & 0 & 0 & 0\\ -1& 1 & 0& 0\\ 0 & -1& 1& 0\\ 0 & 0 & -1& 1 \end{bmatrix}^{-1}

所以,得证明!

或者

[v_1-v_2, v_2-v_3, v_3-v_4, v_4]\begin{bmatrix} \lambda_1\\ \lambda_2\\ \lambda_3\\ \lambda_4 \end{bmatrix}=0=>[v_1, v_2,v_3, v_4]\begin{bmatrix} 1 & 0 & 0 & 0\\ -1& 1 & 0& 0\\ 0 & -1& 1& 0\\ 0 & 0 & -1& 1 \end{bmatrix}\begin{bmatrix} \lambda_1\\ \lambda_2\\ \lambda_3\\ \lambda_4 \end{bmatrix}=[v_1, v_2,v_3, v_4]\begin{bmatrix} \lambda_1\\ \lambda_2-\lambda_1\\ \lambda_3-\lambda_2\\ \lambda_4-\lambda_3 \end{bmatrix}=0

\begin{bmatrix} \lambda_1\\ \lambda_2-\lambda_1\\ \lambda_3-\lambda_2\\ \lambda_4-\lambda_3 \end{bmatrix}=0=>\begin{bmatrix} \lambda_1\\ \lambda_2\\ \lambda_3\\ \lambda_4 \end{bmatrix}=\vec{0}=>\lambda_1=\lambda_2=\lambda_3=\lambda_4=0

也就是v_1-v_2, v_2-v_3, v_3-v_4, v_4线性无关,线性无关的一组向量可以作为F^4的一组基,所以得证!

以上就是两种方法的证明!

8若将C视为R上的向量空间,则组 1+i, 1-i是线性无关的。

   若将C视为C上的向量空间,则组1+i, 1-i是线性相关的。

 \\ \lambda_1=a+bi\\ \lambda_2=c+di

\\ \lambda_1(1+i)+\lambda_2(1-i) = (a+bi)(1+i)+(c+di)(1-i)=a+bi+ai-b+c+di-ci+d=(a-b+c+d)+(b+a+d-c)i

在R上,b=d=0

所以

\\a+bi+ai-b+c+di-ci+d=(a-b+c+d)+(b+a+d-c)i=(a+c)+(a-c)i=0=>a=c=0

在C上

(a-b+c+d)+(b+a+d-c)i=0

两个方程,四个未知数,解空间是二维平面,所以有无穷多个解,例如.

a=d=0, b=c=1

得到 \lambda_1=i, \lambda_2=1

\\ i(1+i)+1(1-i)=0

结束!

9:

f_n=\left\{\begin{matrix} x-\frac{1}{n} \qquad \qquad x\geqslant \frac{1}{n};\\ 0 \qquad \qquad \quad \quad x\in[0, \frac{1}{n}] \end{matrix}\right.

 f_n是区间[0,1]上的连续函数。

证明f_{n+1}\notin\text{span}\{f_1,\cdots,f_n\}

f_1=\left\{\begin{matrix} x-1 \qquad x\geqslant 1;\\ 0 \qquad \qquad \quad x\in[0, 1] \end{matrix}\right.

f_2=\left\{\begin{matrix} x-\frac{1}{2} \qquad \qquad x\geqslant \frac{1}{2};\\ 0 \qquad \qquad \quad \quad x\in[0, \frac{1}{2}] \end{matrix}\right.

f_3=\left\{\begin{matrix} x-\frac{1}{3} \qquad \qquad x\geqslant \frac{1}{3};\\ 0 \qquad \qquad \quad \quad x\in[0, \frac{1}{3}] \end{matrix}\right.

\vdots

f_n=\left\{\begin{matrix} x-\frac{1}{n} \qquad \qquad x\geqslant \frac{1}{n};\\ 0 \qquad \qquad \quad \quad x\in[0, \frac{1}{n}] \end{matrix}\right.

f_{n+1}=\left\{\begin{matrix} x-\frac{1}{n+1} \qquad \qquad x\geqslant \frac{1}{n+1};\\ 0 \qquad \qquad \quad \quad x\in[0, \frac{1}{n+1}] \end{matrix}\right.

假如存在 \lambda_1, \lambda_2, \lambda_3,\cdots,\lambda_n

使得:

\\ f_{n+1}(x)=\lambda_1f_1(x)+\lambda_2f_2(x)+\lambda_3f_3(x)+\cdots+\lambda_nf_n(x)

根据如下函数图形,当x取1/n的时候

\\ \lambda_1f_1(\frac{1}{n})+\lambda_2f_2(\frac{1}{n})+\lambda_3f_3(\frac{1}{n})+\cdots+\lambda_nf_n(\frac{1}{n})\\ \\ =\lambda_1*0+\lambda_2*0+\cdots+\lambda_n*0=0

但是

\\ f_{n+1}(\frac{1}{n})=\frac{1}{n(n+1)}

所以,显然,不存在n+1次的函数能够用<=n次的函数表达的情况,函数无关。

9:对于线性变换 Y=AX,计算他在新坐标基B下的变换矩阵。

\\Y=B{Y}' \\X=BX'

所以:

Y=AX=>BY'=ABX'=>Y'=B^{-1}ABX'

所以:

Y'=B^{-1}ABX'

所以新基下的变换为:B^{-1}AB

10:内积的定义:

 \begin{bmatrix} u_x &u_y \end{bmatrix}\begin{bmatrix} x\\ y \end{bmatrix} = u_x*x+u_y*y

\begin{bmatrix} u_x\\ u_y \end{bmatrix}\cdot \begin{bmatrix} x\\ y \end{bmatrix} = u_x*x+u_y*y

对于任何

\begin{bmatrix} u_x\\ u_y \end{bmatrix},可以将其单位化:

\begin{bmatrix} u'_x\\ u'_y \end{bmatrix}=\begin{bmatrix} \frac{u_x}{\sqrt{u^2_x+u^2_y}}\\ \frac{u_y}{\sqrt{u^2_x+u^2_y}} \end{bmatrix}

11:转置矩阵和原矩阵具有相同的特征多项式,也就是具有相同的特征值.

\left | A-\lambda E \right | = \left | (A-\lambda E)^T \right|= \left | A^T-\lambda E \right |

12:向量刻画对象,矩阵刻画对象的运动,矩阵的本质是对运动的描述,线性空间中的跃迁,交换.

\begin{bmatrix} 2 & 0\\ 0 & 3 \end{bmatrix}\begin{bmatrix} 1\\ 1 \end{bmatrix}=\begin{bmatrix} 2\\ 3 \end{bmatrix}

运动的方式*对象=运动后的对象

12:利用范德蒙德行列式证明,属于不同特征值的特征向量线性无关:

课本上用数学归纳法,不太喜欢反证法和归纳法,还是用演绎法来证明:

假设n阶梯矩阵A有n个不同的特征值,分别为:

\lambda_1,\quad \lambda_2,\quad \cdots \quad \lambda_n

其对应的特征向量分别为:

\vec{v}_1,\quad \vec{v}_2,\quad \cdots \quad \vec{v}_n

证明:使得k_1\vec{v}_1+k_2\vec{v}_2+\cdots+k_n\vec{v}_n=0成立的只能是 k_1=k_2=\cdots=k_n=0

证明过程:根据已知条件下式成立:

   \\A\vec{v}_1=\lambda_1\vec{v}_1\\ A\vec{v}_2=\lambda_2\vec{v}_2\\ \qquad \vdots\\ A\vec{v}_n=\lambda_n\vec{v}_n\\

 并且:A^{m}\vec{v}_i=\lambda^{m}_i\vec{v}_i

如果k_1\vec{v}_1+k_2\vec{v}_2+\cdots+k_n\vec{v}_n=0成立,那么下面的式一定成立:

\\A^0(k_1\vec{v}_1+k_2\vec{v}_2+\cdots+k_n\vec{v}_n)=\vec{0}\\ A^1(k_1\vec{v}_1+k_2\vec{v}_2+\cdots+k_n\vec{v}_n)=\vec{0} \\ A^2(k_1\vec{v}_1+k_2\vec{v}_2+\cdots+k_n\vec{v}_n)=\vec{0} \\ \vdots \\ A^{n-1}(k_1\vec{v}_1+k_2\vec{v}_2+\cdots+k_n\vec{v}_n)=\vec{0} \\

等价于:

\\k_1\vec{v}_1+k_2\vec{v}_2+\cdots+k_n\vec{v}_n=\vec{0}\\ k_1\lambda_1\vec{v}_1+k_2\lambda_2\vec{v}_2+\cdots+k_n\lambda_n\vec{v}_n=\vec{0}\\ k_1\lambda^2_1\vec{v}_1+k_2\lambda^2_2\vec{v}_2+\cdots+k_n\lambda^2_n\vec{v}_n=\vec{0}\\ \vdots\\ k_1\lambda^{n-1}_1\vec{v}_1+k_2\lambda^{n-1}_2\vec{v}_2+\cdots+k_n\lambda^{n-1}_n\vec{v}_n=\vec{0}

转化成矩阵形式:

\begin{bmatrix} k_1\vec{v}_1 & k_2\vec{v}_2 & \cdots& k_n\vec{v}_n \end{bmatrix} \begin{bmatrix} 1 & \lambda_1 & \cdots & \lambda^{n-1}_1 \\ 1 & \lambda_2 & \cdots & \lambda^{n-1}_2 \\ \vdots & \vdots & \ddots & \vdots \\ 1 & \lambda_n & \cdots & \lambda^{n-1}_n \end{bmatrix}=\begin{bmatrix} \vec{0} & \vec{0} & \cdots& \vec{0} \end{bmatrix}= \begin{bmatrix} 0 & 0 & \cdots & 0 \\ 0 & 0 & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & 0 \end{bmatrix}

也就是

\begin{bmatrix} k_1\vec{v}_1 & k_2\vec{v}_2 & \cdots& k_n\vec{v}_n \end{bmatrix} \begin{bmatrix} 1 & \lambda_1 & \cdots & \lambda^{n-1}_1 \\ 1 & \lambda_2 & \cdots & \lambda^{n-1}_2 \\ \vdots & \vdots & \ddots & \vdots \\ 1 & \lambda_n & \cdots & \lambda^{n-1}_n \end{bmatrix}= \begin{bmatrix} 0 & 0 & \cdots & 0 \\ 0 & 0 & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & 0 \end{bmatrix}

其中:

\begin{bmatrix} 1 & \lambda_1 & \cdots & \lambda^{n-1}_1 \\ 1 & \lambda_2 & \cdots & \lambda^{n-1}_2 \\ \vdots & \vdots & \ddots & \vdots \\ 1 & \lambda_n & \cdots & \lambda^{n-1}_n \end{bmatrix}

是范德蒙德行列式,其行列式的值为:

\begin{vmatrix} 1 & \lambda_1 & \cdots & \lambda^{n-1}_1 \\ 1 & \lambda_2 & \cdots & \lambda^{n-1}_2 \\ \vdots & \vdots & \ddots & \vdots \\ 1 & \lambda_n & \cdots & \lambda^{n-1}_n \end{vmatrix}=\prod_{n\geqslant i>j\geqslant 1}(\lambda_i-\lambda_j)

引用特征向量各不相同的条件,则此范德蒙德行列式一定不等于0.得出此范德蒙德矩阵是满秩矩阵.

满秩矩阵就一定有唯一的逆,所以

\begin{bmatrix} k_1\vec{v}_1 & k_2\vec{v}_2 & \cdots& k_n\vec{v}_n \end{bmatrix} = \begin{bmatrix} 0 & 0 & \cdots & 0 \\ 0 & 0 & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & 0 \end{bmatrix}\begin{bmatrix} 1 & \lambda_1 & \cdots & \lambda^{n-1}_1 \\ 1 & \lambda_2 & \cdots & \lambda^{n-1}_2 \\ \vdots & \vdots & \ddots & \vdots \\ 1 & \lambda_n & \cdots & \lambda^{n-1}_n \end{bmatrix}^{-1}=\begin{bmatrix} \vec{0} & \vec{0} & \cdots& \vec{0} \end{bmatrix}

由于\vec{v}_1,\quad \vec{v}_2,\quad \cdots \quad \vec{v}_n作为特征向量,特征向量表示方向,不可能为0, 那么

只能是k_1=k_2=\cdots=k_n=0,得证.

还可以认为,矩阵:

\begin{bmatrix} k_1\vec{v}_1 & k_2\vec{v}_2 & \cdots& k_n\vec{v}_n \end{bmatrix}

的解空间的秩为n,根据维数定理,解空间的秩+矩阵的秩=n,则矩阵的秩一定为0.

什么样的矩阵秩才为0呢?当然是0矩阵,根据上面的逻辑,同理得出,k_1=k_2=\cdots=k_n=0

所以属于不同特征值的特征向量线性无关.

QED!

12:A\Lambda相似,则 A=P^{-1}\Lambda P,那么A-\lambda E\Lambda-\lambda E有什么关系?

 因为P^{-1}(A-\lambda E)P=P^{-1}AP-P^{-1}\lambda EP=\Lambda-\lambda E

所以 (A-\lambda E)(\Lambda-\lambda E)相似

13:实对称矩阵的特征值为实数

  复数\lambda为实对称矩阵A的特征值,复向量\mathbf{x}为对应的特征向量,即:

 A\mathbf{x}=\lambda \textbf{x} \quad \textbf{x}\neq \vec{\textbf{0}}

\overline{\lambda}表示\lambda的共轭复数,\overline{\textbf{x}}表示\textbf{x}的共轭复向量.那么

A\overline{\textbf{x}}=\overline{A}\overline{\textbf{x}}=\overline{(A\textbf{x})}=\overline{(\lambda \textbf{x})}=\overline{\lambda}\overline{\textbf{x}}

从上式也可以得出,如果结论为真,那么\overline{\textbf{x}}也为A的特征向量.

于是有:

\overline{\textbf{x}}^TA\overline{\textbf{x}}=\overline{\textbf{x}}^T(A\overline{\textbf{x}})=\overline{\textbf{x}}^T(\lambda\overline{\textbf{x}})=\lambda \overline{\textbf{x}}^T \overline{\textbf{x}}

\overline{\textbf{x}}^TA\overline{\textbf{x}}=\overline{\textbf{x}}^TA^T\overline{\textbf{x}}={(A\overline{\textbf{x}})}^T\overline{\textbf{x}}={(\overline{\lambda}\overline{\textbf{x}})}^T\overline{\textbf{x}}=\overline{\lambda}\overline{\textbf{x}}^T \overline{\textbf{x}}

让两式相减:

(\lambda - \overline \lambda)\overline{\textbf{x}}^T \overline{\textbf{x}}=0

由于

\textbf{x}\neq \vec{\textbf{0}}

所以,

\overline{\textbf{x}}^T \overline{\textbf{x}}=\sum_{i=1}^{n}\overline{x_i}x_i=\sum_{i=1}^{n}{\left |{x_i} \right |}^2\neq 0

所以

(\lambda - \overline \lambda)=0

也就是\lambda = \overline \lambda

即,特征值为实数.

由于实对称矩阵的特征值是实数,所以,齐次线性方程组

(A-\lambda_iE)\vec{x}=\vec{0}

是实系数线性方程组,又由于

\left|A-\lambda_iE\right |=0

得到

Rank(A-\lambda_iE)< n,所以其必有非平凡实数解,必有实的基础解系.所以,实对称矩阵不但特征值是实数,对应的特征向量也是实向量.

14:设\lambda_1,\lambda_2是实对称矩阵的两个特征值,\vec{p}_1, \vec{p}_2是对应的特征向量,若\lambda_1\neq\lambda_2,则\vec{p_1}\vec{p}_2正交.

已知条件,\lambda_1\neq\lambda_2A^T=A

A\vec{p}_1=\lambda_1\vec{p}_1

A\vec{p}_2=\lambda_2\vec{p}_2

所以:

\lambda_1 {\vec{p_1}}^T=(\lambda_1 \vec{p_1})^T=(A\vec{p_1})^T=\vec{p_1}^TA^T=\vec{p_1}^TA

于是:

\lambda_1\vec{p_1}^T\vec{p_2}=\vec{p_1}^TA\vec{p_2}=\vec{p_1}^T\lambda_2\vec{p_2}=\lambda_2\vec{p_1}^T\vec{p_2}

所以:

(\lambda_1-\lambda_2)\vec{p_1}^T\vec{p_2}=0

由于\lambda_1\neq\lambda_2,所以只能是\vec{p_1}^T\vec{p_2}=0成立,也即是\vec{p_2}, \vec{p_2}正交.

15:若\{​{\vec{q}_1, \vec{q}_2, \quad ... \quad ,\vec{q}_k}\}是一组n维标准正交向量组,求矩阵

\sum_{i=1}^{k}\vec{q}_i\vec{q_i}^T

的所有特征值.

标准正交,所以:

{\vec{q}_i}^T\vec{q}_j = \left\{\begin{matrix} 1 \qquad i=j\\ 0 \qquad i\neq j \end{matrix}\right.

展开:

M=\sum_{i=1}^{k}\vec{q}_i\vec{q_i}^T= (\vec{q_1}\vec{q_1}^T + \vec{q_2}\vec{q_2}^T + \cdots + \vec{q_k}\vec{q_k}^T)

则:

\\M^2= (\vec{q_1}\vec{q_1}^T + \vec{q_2}\vec{q_2}^T + \cdots + \vec{q_k}\vec{q_k}^T)^2 \\= \vec{q_1}\vec{q_1}^T\vec{q_1}\vec{q_1}^T + \vec{q_2}\vec{q_2}^T\vec{q_2}\vec{q_2}^T + \cdots + \vec{q_k}\vec{q_k}^T\vec{q_k}\vec{q_k}^T + \vec{q_1}\vec{q_1}^T\vec{q_2}\vec{q_2}^T + \cdots

根据正交条件,交叉项全部为0,\vec{q_k}\vec{q_k}^T\vec{q_k}\vec{q_k}^T=1

所以

\\M^2= (\vec{q_1}\vec{q_1}^T + \vec{q_2}\vec{q_2}^T + \cdots + \vec{q_k}\vec{q_k}^T) = M

也就是

\\M^2= M

所以,特征多项式为:

\lambda^2=\lambda=>\lambda(\lambda - 1)= 0=>\lambda =1 \ or \ \lambda = 0

也就是特征值为\lambda =1或者\lambda = 0

验证:

\lambda =1

M^2=M=>(M-E)M=\boldsymbol{0}=>(M-1\cdot E)M=0

所以,M的每个列向量都是\lambda =1的特征向量。

同理:

M^2=M=>(M-E)M=\boldsymbol{0}=>(M-0\cdot E)(M-E)=0

所以,M-E的每个列向量都是0的特征向量。

16:对于n阶可逆矩阵A,设其任意一个非零特征值\lambda,对应的特征向量\mathbf{\vec{x}},则

  A\mathbf{\vec{x}}=\lambda \mathbf{\vec{x}}

连边同时左乘A^{-1}

A^{-1}A\mathbf{\vec{x}}=A^{-1}\lambda \mathbf{\vec{x}}=>\mathbf{\vec{x}}=A^{-1}\lambda \mathbf{\vec{x}}

然后两边乘以\frac{1}{\lambda},得到:

\frac{1}{\lambda}\mathbf{\vec{x}}=A^{-1}\mathbf{\vec{x}}

也就是:

A^{-1}\mathbf{\vec{x}}=\frac{1}{\lambda}\mathbf{\vec{x}}

所以,\frac{1}{\lambda}是 A^{-1}的特征值,对应特征向量不变,仍然为\mathbf{\vec{x}}.

特征向量不为\boldsymbol{\vec{0}}, 所以,对于0特征值的情况

A\mathbf{\vec{x}}=0\cdot \mathbf{\vec{x}}=>A\mathbf{\vec{x}}=\mathbf{\vec{0}}

所以,齐次方程

A\vec{x}=\vec{0}

有非0解,进而得到 Rank(A)<n,得到

 \left | A \right| = 0A\vec{x}=\vec{0}

17: An阶正定矩阵,则

    \left | A\right |\leqslant a_{11}a_{22}\cdots a_{nn}

正定矩阵,A是对称方阵,则,写成分块的形式:

A_{n\times n}= \begin{bmatrix} a_{11}& a_{12}& \cdots & a_{1n}\\ a_{12}& a_{22}& \cdots & a_{2n}\\ \vdots & \vdots & \ddots & \vdots \\ a_{1n}& a_{2n}& \cdots & a_{nn} \end{bmatrix} = \begin{bmatrix} A_{n-1} & \vec{\alpha}\\ \vec{\alpha}^T& a_{nn} \end{bmatrix} \qquad \vec{\alpha} =\begin{bmatrix} a_{1n}\\ a_{2n}\\ \vdots \\ a_{(n-1)n} \end{bmatrix}

对矩阵尽心给出等列变换,用第二列减去第一列右乘以{A_{n-1}}^{-1}} \vec{\alpha},行列式不变,所以:

\\ \left |A_{n\times n} \right|= \begin{vmatrix} A_{n-1} & \vec{\alpha}\\ \vec{\alpha}^T& a_{nn} \end{vmatrix} =\begin{vmatrix} A_{n-1} & \vec{\alpha}-A_{n-1}{A_{n-1}}^{-1}\vec{\alpha} \\ \vec{\alpha}^T& a_{nn}- \vec{\alpha}^T{A_{n-1}}^{-1}\vec{\alpha}\end{vmatrix} = \begin{vmatrix} A_{n-1} & \vec{0} \\ \vec{\alpha}^T& a_{nn}- \vec{\alpha}^T{A_{n-1}}^{-1}\vec{\alpha}\end{vmatrix} = \left | A_{n-1} \right |(a_{nn}-\vec{\alpha}^T{A_{n-1}}^{-1}\vec{\alpha})

也就是:

\\ \left |A_{n\times n} \right| = \left | A_{n-1} \right |(a_{nn}-\vec{\alpha}^T{A_{n-1}}^{-1}\vec{\alpha})

根据已知矩阵正定的条件,一个矩阵是正定的,当且仅当它的各阶顺序主子式是正定的,所以A_{n-1}必然也是正定的。

根据正定矩阵的要求,\vec{\alpha}^T{A_{n-1}}^{-1}\vec{\alpha}>0 \quad \vec{\alpha} \neq \vec{0}

所以

\\ \left |A_{n\times n} \right| = \left | A_{n-1} \right |(a_{nn}-\vec{\alpha}^T{A_{n-1}}^{-1}\vec{\alpha})< \left | A_{n-1} \right | a_{nn}

所以得到:

\\ \left |A_{n\times n} \right| < \left | A_{n-1} \right | a_{nn}

同理,可以得到 

\\ \left |A_{​{n-1}\times {n-1}} \right| < \left | A_{n-2} \right | a_{(n-1)(n-1)} \\ \left |A_{​{n-2}\times {n-2}} \right| < \left | A_{n-3} \right | a_{(n-2)(n-2)} \\ \vdots \\ \left |A_{2 \times 2}} \right| < a_{11} a_{22}

所以

\left | A\right |\leqslant a_{11}a_{22}\cdots a_{nn}
得证!

18.若P为正交矩阵,则线性变换

\vec{y}=P\vec{x}

称为正交变换 

则 

\left \| \vec{y} \right \|=\sqrt{\vec{y}^T\vec{y}}=\sqrt{\vec{x}^TP^TP\vec{x}}=\sqrt{\vec{x}^T\vec{x}}=\left \| \vec{x} \right \|

由于\left \| \vec{x} \right \| 2-范数表示向量长度,所以,\left \| \vec{y} \right \|=\left \| \vec{x} \right \|说明经过正交变换后,线段长度保持不变,从而几何形状保持不变,这是正交变换的特性.

19:设\lambda_1\lambda_2是方阵A的两个不同特征值, \epsilon_1, \epsilon_2, \cdots, \epsilon_s\eta_1, \eta_2, \cdots, \eta_t分别对应于\lambda_1\lambda_2的线性无关特征向量,则 \epsilon_1, \epsilon_2, \cdots, \epsilon_s \eta_1, \eta_2, \cdots, \eta_t线性无关.

题设可知:

A\epsilon_i=\lambda_1\epsilon_i \quad (1<i<s )

A\eta_j=\lambda_2\eta_j \quad (1<j<t )

假设

k_1\epsilon_1 + k_2\epsilon_2+\cdots + k_s\epsilon_s + k_{s+1}\eta_1 + k_{s+2}\eta_2+\cdots+k_{s+t}\eta_{t} = 0 \quad \textcircled{1}

两边同时乘以AAA得:

A(k_1\epsilon_1 + k_2\epsilon_2+\cdots + k_s\epsilon_s)+ A(k_{s+1}\eta_1 + k_{s+2}\eta_2+\cdots+k_{s+t}\eta_{t}) = 0

\lambda_1(k_1\epsilon_1 + k_2\epsilon_2+\cdots + k_s\epsilon_s)+ \lambda_2(k_{s+1}\eta_1 + k_{s+2}\eta_2+\cdots+k_{s+t}\eta_{t}) = 0 \quad \textcircled{2}

\textcircled{2}-\lambda_2\textcircled{1}得:

\lambda_1(k_1\epsilon_1 + k_2\epsilon_2+\cdots + k_s\epsilon_s)- \lambda_2(k_1\epsilon_1 + k_2\epsilon_2+\cdots + k_s\epsilon_s) = 0 \quad \textcircled{3}

所以

(\lambda_1-\lambda_2)(k_1\epsilon_1 + k_2\epsilon_2+\cdots + k_s\epsilon_s) = 0 \quad \textcircled{4}

由于\lambda_1\neq \lambda_2,所以

k_1\epsilon_1 + k_2\epsilon_2+\cdots + k_s\epsilon_s = 0 \quad \textcircled{5}

因为\epsilon_1, \epsilon_2, \cdots, \epsilon_s线性无关,所以

 k_1=k_2= \cdots=k_s = 0\quad \textcircled{6}

从而\textcircled{1}式可以化简为

k_{s+1}\eta_1 + k_{s+2}\eta_2+\cdots+k_{s+t}\eta_{t} = 0 \quad \textcircled{7}

同样因为\eta_1, \eta_2, \cdots, \eta_t线性无关.

k_{s+1}=k_{s+2}= \cdots=k_{s+t} = 0\quad \textcircled{8}

根据\textcircled{6}, \textcircled{8} 得到:

k_1=k_2= \cdots=k_s = k_{s+1}=k_{s+2}= \cdots=k_{s+t}=0\quad \textcircled{9}

所以,线性无关结论成立.

20:f(A)=a_0A^n+a_1A^{n-1}+\cdots+a_{n-1}A+a_nE 

如果A=P^{-1}\Lambda P

则:

\\f(A)=a_0A^n+a_1A^{n-1}+\cdots+a_{n-1}A+a_nE\\=P^{-1}a_0\Lambda ^nP + P^{-1}a_1\Lambda ^{n-1}P+\cdots+P^{-1}a_{n-1}\Lambda P + P^{-1}a_nEP\\=P^{-1}f(\Lambda)P

21:证明对称矩阵AA为正定的充分必要条件是:存在可逆矩阵U,使得A=U^TU,也就是A与单位矩阵E合同.

充分性:

A对称且正定,则存在正交矩阵P,使得A=P^{-1}\Lambda P=P^T \Lambda P

设矩阵CC是对角矩阵\Lambda对角元的平方根的对角阵,则:

\Lambda =C^2=C\cdot C=C^TC

所以,

A=P^{-1}\Lambda P=P^T \Lambda P=P^TC^TCP=(PC)^T(PC)

U=PC ,由于P,C均为可逆阵,所以U必为可逆阵.

得到  

A=P^{-1}\Lambda P=P^T \Lambda P=P^TC^TCP=(PC)^T(PC) = U^TU

必要性:

A=U^TU=>\vec{x}^TU^TU\vec{x}= (U\vec{x})^T(U\vec{x})= \left \|U\vec{x} \right \|^2 \geq 0

所以,A必正定.

QED! 

22:  \left | AB \right| = \left | A\right | \left | B\right |

AB(i,j)元为:

  \sum_{k=1}^{n}a_{ik}b_{kj}

则:

\\\left | AB \right| =\sum_{1}^{n!}(-1)^tc_{1p_1}c_{2p_2}\cdots c_{np_n} = \sum_{1}^{n!}(-1)^t(\sum_{k_1=1}^{n}a_{1k_1}b_{k_1p_1} \cdot \sum_{k_2=1}^{n}a_{2k_2}b_{k_2p_2} \cdots \sum_{k_n=1}^{n}a_{nk_n}b_{k_np_n} )

\\ \quad t = nixu(p_1p_2\cdots p_n) \quad p_1p_2\cdots p_n是自然数1\quad2\quad3 \cdots n 的一个排列.

代数证明卡壳了,先写到这里,后面想到在补充.下面换另一个思路证明:

对于任一初等矩阵E

 det(EA)=det(E)det(A)=det(AE)

如果A,B 奇异,则

det(AB)=det(A)det(B)=0

如果B非奇异,则

 \\det(AB)= det(AE_kE_{k-1}\cdots E_1)=det(A)det(E_k)det(E_{k-1})\cdots det(E_1)\\=det(A)det(E_kE_{k-1}\cdots E_1)=det(A)det(B)

23:

A=\begin{bmatrix} 0 & 1& 0& 0 & 0\\ 1 & 0& 0 & 0& 1\\ 0 & 0& 0 & 1& 1\\ 0 & 0& 1& 0& 1\\ 0 & 1& 1& 1& 0 \end{bmatrix} 

A为某图的n\times n邻接矩阵,且

a^k_{ij}

表示A^k(i,j)元素,则a^k_{ji}等于顶点V_iV_iV_j间长度为k的路的条数

证明:利用数学归纳法,k=1时,由邻接矩阵定义得知,a_{ij}表示从顶点V_iV_j长度为1的路的数量,假设对某个m,矩阵A^m中的每一元素表示相应两顶点间长度为m的路的数量,因此,a^m_{il}表示从顶点V_iV_l长度为m的路的数量,如果有一条边\left \{ V_l,V_j \right \},则

a^m_{il}a_{lj}=a^m_{il}\cdot 1=a^m_{il}

表示从顶点V_iV_j长度为m+1的形如:

V_i\rightarrow \cdots \rightarrow V_l\rightarrow V_j

的路的数量,另一方面,如果\left \{ V_l,V_j \right \}不是一条边,则从V_iV_j没有长度为m+1的路,并且

a^m_{il}a_{lj}=a^m_{il}\cdot 0=0 

所以,可以得到,从V_iV_j长度为m+1的所有路的总数为:

a^m_{i1}a_{1j} + a^m_{i2}a_{2j}+\cdots+a^m_{in}a_{nj}

而恰好是A^{m+1}(i,j)元素.

A^{m+1} = A\cdot A^m = \begin{bmatrix} a^m_{11}& a^m_{12}& \cdots & a^m_{1n}\\ a^m_{21}& a^m_{22}& \cdots & a^m_{2n}\\ \vdots & \vdots & \ddots & \vdots \\ a^m_{n1}& a^m_{n2}& \cdots & a^m_{nn} \end{bmatrix}*\begin{bmatrix} a_{11}& a_{12}& \cdots & a_{1n}\\ a_{21}& a_{22}& \cdots & a_{2n}\\ \vdots & \vdots & \ddots & \vdots \\ a_{n1}& a_{n2}& \cdots & a_{nn} \end{bmatrix} = \begin{bmatrix} a^{m+1}_{11}& a^{m+1}_{12}& \cdots & a^{m+1}_{1n}\\ a^{m+1}_{21}& a^{m+1}_{22}& \cdots & a^{m+1}_{2n}\\ \vdots & \vdots & \ddots & \vdots \\ a^{m+1}_{n1}& a^{m+1}_{n2}& \cdots & a^{m+1}_{nn} \end{bmatrix}

24:设n阶矩阵A=(a_{ij})的特征值为\lambda_1, \lambda_2,\cdots \lambda_n,证明:

  1. \lambda_1 + \lambda_2 + \cdots + \lambda_n = a_{11} + a_{12} + \cdots + a_{1n}
  2. \lambda_1\lambda_2\cdots\lambda_n = \left|A\right|

   证明:

   p(\lambda)A的特征多项式,则:

    p(\lambda)=det(A-\lambda E)= \begin{bmatrix} a_{11}-\lambda& a_{12}& \cdots & a_{1n}\\ a_{21}& a_{22}-\lambda& \cdots & a_{2n}\\ \vdots & \vdots & \ddots & \vdots \\ a_{n1}& a_{n2}& \cdots & a_{nn}-\lambda \end{bmatrix}

  按照第一列进行展开,可以得到:

 p(\lambda)=det(A-\lambda E)=(a_{11}-\lambda)det(M_{11}) + \sum_{i=2}^{n}a_{i1}(-1)^{i+1}det(M_{i1})   

 将M_{11}按照同样的方式展开:

 \\M_{11}=(a_{22}-\lambda)det(M'_{11}) + \sum_{j=3}^{n}a_{j2}(-1)^{j+2}det(M'_{j1}) \\ M'_{11}=(a_{33}-\lambda)det(M''_{11}) + \sum_{k=4}^{n}a_{k3}(-1)^{k+3}det(M''_{k1})\\ \vdots

其中M_{i1}M_{i1} 不包括两个对焦元素(a_{11}-\lambda)(a_{ii}-\lambda),更徨论其余的子式了.

所以,det(A-\lambda E)的展开式式中唯一包含多于n-2个对角元素的项,一定是

(a_{11}-\lambda)(a_{22}-\lambda)\cdots(a_{nn}-\lambda)

同时 p(\lambda) = (\lambda_1 - \lambda) (\lambda_2 - \lambda)\cdots(\lambda_n -\lambda)

对照两个式子的\lambda^{n-1}系数,得到\lambda_1 + \lambda_2 + \cdots + \lambda_n = a_{11} + a_{12} + \cdots + a_{1n}

\lambda=0,根据跟与系数的关系,可得:

p(0) = (\lambda_1 - 0) (\lambda_2 - 0)\cdots(\lambda_n -0)=\lambda_1\lambda_2\cdots\lambda_n = det(A)

QED!

25:cramer法则的证明:

 \\a_{11}x_1 + a_{12}x_2+\cdots + a_{1n}x_n = b_1 \\a_{21}x_1 + a_{22}x_2+\cdots + a_{2n}x_n = b_2 \\ \vdots \\a_{n1}x_1 + a_{n2}x_2+\cdots + a_{nn}x_n = b_2

如果:

A_{n\times n}= \begin{bmatrix} a_{11}& a_{12}& \cdots & a_{1n}\\ a_{21}& a_{22}& \cdots & a_{2n}\\ \vdots & \vdots & \ddots & \vdots \\ a_{n1}& a_{n2}& \cdots & a_{nn} \end{bmatrix}

\\ \vec{x}= {\begin{bmatrix} x_1\\ x_2\\ \vdots \\ x_n \end{bmatrix} \\ \quad \vec{b}= {\begin{bmatrix} b_1\\ b_2\\ \vdots \\ b_n \end{bmatrix}

所以

\begin{bmatrix} a_{11}& a_{12}& \cdots & a_{1n}\\ a_{21}& a_{22}& \cdots & a_{2n}\\ \vdots & \vdots & \ddots & \vdots \\ a_{n1}& a_{n2}& \cdots & a_{nn} \end{bmatrix}\cdot {\begin{bmatrix} x_1\\ x_2\\ \vdots \\ x_n \end{bmatrix} = {\begin{bmatrix} b_1\\ b_2\\ \vdots \\ b_n \end{bmatrix}

矩阵AA的伴随矩阵为:

adj A=\begin{bmatrix} A_{11}& A_{21}& \cdots & A_{n1}\\ A_{12}& A_{22}& \cdots & A_{n2}\\ \vdots & \vdots & \ddots & \vdots \\ A_{1n}& A_{2n}& \cdots & A_{nn} \end{bmatrix}

将前式乘以伴随矩阵

\begin{bmatrix} A_{11}& A_{21}& \cdots & A_{n1}\\ A_{12}& A_{22}& \cdots & A_{n2}\\ \vdots & \vdots & \ddots & \vdots \\ A_{1n}& A_{2n}& \cdots & A_{nn} \end{bmatrix} \cdot \begin{bmatrix} a_{11}& a_{12}& \cdots & a_{1n}\\ a_{21}& a_{22}& \cdots & a_{2n}\\ \vdots & \vdots & \ddots & \vdots \\ a_{n1}& a_{n2}& \cdots & a_{nn} \end{bmatrix}\cdot {\begin{bmatrix} x_1\\ x_2\\ \vdots \\ x_n \end{bmatrix} =\begin{bmatrix} A_{11}& A_{21}& \cdots & A_{n1}\\ A_{12}& A_{22}& \cdots & A_{n2}\\ \vdots & \vdots & \ddots & \vdots \\ A_{1n}& A_{2n}& \cdots & A_{nn} \end{bmatrix} \cdot {\begin{bmatrix} b_1\\ b_2\\ \vdots \\ b_n \end{bmatrix}

也就是:

\begin{bmatrix} \left|A\right|& 0& \cdots & 0\\ 0& \left|A\right|& \cdots & 0\\ \vdots & \vdots & \ddots & \vdots \\ 0& 0& \cdots & \left|A\right| \end{bmatrix} \cdot {\begin{bmatrix} x_1\\ x_2\\ \vdots \\ x_n \end{bmatrix}= {\begin{bmatrix} b_1A_{11}+b_2A_{21}+\cdots+b_nA_{n1}\\ b_1A_{12}+b_2A_{22}+\cdots+b_nA_{n2}\\ \vdots \\ b_1A_{1n}+b_2A_{2n}+\cdots+b_nA_{nn} \end{bmatrix}

所以:

x_i=\frac{b_1A_{1i}+b_2A_{2i}+\cdots+b_nA_{ni}}{\left|A\right|} = \frac{det(A_i)}{det(A)}

26:另

   E=\begin{bmatrix} \vec{v}_1 & \vec{v}_2& \cdots & \vec{v}_n \end{bmatrix}

  F=\begin{bmatrix} \vec{w}_1 & \vec{w}_2& \cdots & \vec{w}_n \end{bmatrix}

L为一个向量空间VV的两个有序基,并令LLV上的线性算子,令S为从FE的转移表示矩阵.

\vec{x} = \begin{bmatrix} x_1\\ x_2\\ \vdots \\ x_n \end{bmatrix}

为向量 \vec{k}F世界中的坐标

则转换成标准坐标系下表示的坐标为:

\vec{k}=x_1\vec{w}_1 + x_2 \vec{w}_2 + \cdots + x_n\vec{w}_n=\begin{bmatrix} \vec{w}_1 & \vec{w}_2& \cdots & \vec{w}_n \end{bmatrix} \begin{bmatrix} x_1\\ x_2\\ \vdots \\ x_n \end{bmatrix} = F\vec{x}

经过S变换后,坐标变为:

\vec{y} = S\vec{x}

所以,\vec{y}E世界的坐标,变为标准坐标系:

E\vec{y} = ES\vec{x}=F\vec{x}\Rightarrow ES=F

所以:

F=ES=\begin{bmatrix} \vec{w}_1 & \vec{w}_2& \cdots & \vec{w}_n \end{bmatrix}=\begin{bmatrix} \vec{v}_1 & \vec{v}_2& \cdots & \vec{v}_n \end{bmatrix}\begin{bmatrix} s_{11}& s_{12}& \cdots & s_{1n}\\ s_{21}& s_{22}& \cdots & s_{2n}\\ \vdots & \vdots & \ddots & \vdots \\ s_{n1}& s_{n2}& \cdots & s_{nn} \end{bmatrix}

\\ \vec{w}_1=s_{11}\vec{v}_1 + s_{21}\vec{v}_2 + \cdots + s_{n1}\vec{v}_n \\ \vec{w}_2=s_{12}\vec{v}_1 + s_{22}\vec{v}_2 + \cdots + s_{n2}\vec{v}_n \\ \vdots \\ \vec{w}_n=s_{1n}\vec{v}_1 + s_{2n}\vec{v}_2 + \cdots + s_{nn}\vec{v}_n

所以,从 E世界的角度看F, \\ \vec{w}_1, \vec{w}_2, \cdots, \vec{w}_n \\的坐标分别为

\begin{bmatrix} s_{11}\\ s_{21}\\ \vdots \\ s_{n1} \end{bmatrix}, \begin{bmatrix} s_{12}\\ s_{22}\\ \vdots \\ s_{n2} \end{bmatrix},\cdots,\begin{bmatrix} s_{1n}\\ s_{2n}\\ \vdots \\ s_{nn} \end{bmatrix}

所以

\\ E\vec{y}=F\vec{x}=>x_1\vec{w_1}+x_2\vec{w_2}+\cdots+x_n\vec{w_n}=y_1\vec{v_1}+y_2\vec{v_2}+\cdots+y_n\vec{v_n} \\\Rightarrow \\S\vec{x}=\vec{y} \\ S^{-1}\vec{y}=\vec{x}

所以S^{-1}是从E到F的转移矩阵.

或者,已知

\\ \vec{w}_1=s_{11}\vec{v}_1 + s_{21}\vec{v}_2 + \cdots + s_{n1}\vec{v}_n \\ \vec{w}_2=s_{12}\vec{v}_1 + s_{22}\vec{v}_2 + \cdots + s_{n2}\vec{v}_n \\ \vdots \\ \vec{w}_n=s_{1n}\vec{v}_1 + s_{2n}\vec{v}_2 + \cdots + s_{nn}\vec{v}_n

\\\vec{v}_f = x_1\vec{w_1}+x_2\vec{w_2}+\cdots+x_n\vec{w_n}= \\x_1(\sum_{j=1}^{n}s_{j1}\vec{v}_j)+x_2(\sum_{j=1}^{n}s_{j2}\vec{v}_j) + \cdots +x_n(\sum_{j=1}^{n}s_{jn}\vec{v}_j) = \\ (\sum_{j=1}^{n}s_{1j}x_j)\vec{v}_1 + (\sum_{j=1}^{n}s_{2j}x_j)\vec{v}_2 + \cdots + (\sum_{j=1}^{n}s_{nj}x_j)\vec{v}_n

因此,若 

\vec{y}=[v]_e

 \\ y_i= \sum_{j=1}^{n}s_{ij}x_j, \qquad i = 1, 2, \cdots , n.

于是

\vec{y}= S\vec{x}


27:若\vec{x}\vec{y}R^2或者R^3中的两个非零向量,且\theta为它们之间的夹角,则:

\vec{x}^T\vec{y} = \left \| \vec{x} \right \| \left \| \vec{y} \right \|cos(\theta)

证明过程:

由余弦定理,我们有:

{\left \|\vec{y}-\vec{x} \right \|}^2 = \left \| \ \vec{x} \right \|^2 + \left \| \vec{y} \right \|^2 - 2\left \| \vec{x} \right \|\left \| \vec{y} \right \|cos(\theta)

得到:

\\ \left \| \vec{x} \right \|\left \| \vec{y} \right \|cos(\theta)=\frac{1}{2}( \left \| \ \vec{x} \right \|^2 + \left \| \vec{y} \right \|^2 - \left \| \vec{y}- \vec{x} \right \|^2) = \\ \frac{1}{2}( \left \| \ \vec{x} \right \|^2 + \left \| \vec{y} \right \|^2 - {(\vec{y}-\vec{x})}^T(\vec{y}-\vec{x})) \\ \frac{1}{2}(\left \| \ \vec{x} \right \|^2 + \left \| \ \vec{y} \right \|^2 - (\vec{y}^T\vec{y} - \vec{y}^T\vec{x} - \vec{x}^T\vec{y} +\vec{x}^T\vec{x})) = \\ \frac{1}{2}(\vec{x}^T\vec{x} + \vec{y}^T\vec{y} - \vec{y}^T\vec{y} + \vec{y}^T\vec{x} + \vec{x}^T\vec{y} -\vec{x}^T\vec{x}) = \vec{x}^T\vec{y}=\vec{y}^T\vec{x} 

QED!

28:旋转矩阵 

  \\Q=\begin{bmatrix} cos(\theta) &-sin(\theta) \\ sin(\theta) & cos(\theta) \end{bmatrix}

 \\Q^{-1}=Q^{T}=\begin{bmatrix} cos(\theta) &sin(\theta) \\ -sin(\theta) & cos(\theta) \end{bmatrix}

< Q\vec{x}, Q\vec{y}>=(Q\vec{x})^TQ\vec{y}=\vec{y}^TQ^TQ\vec{x}=\vec{y}^T\vec{x}

如果\vec{x}=\vec{y},则

\left \| Q\vec{x} \right \|^2 = \left \| \vec{x} \right \|^2\Rightarrow \left \| Q\vec{x}\right \|=\left \| \vec{x} \right \|

所以,对于下向量\vec{x},经过正交变换后,长度不变


28:

C\begin{bmatrix} -\pi,& \pi \end{bmatrix}上定义内积,

< f,g> =\frac{1}{\pi}\int_{-\pi}^{\pi}f(x)g(x)dx,

集合

\begin{Bmatrix} 1, & cos(x) & cos(2x), & \cdots & cos(nx) \end{Bmatrix}

为一个正交向量集合,因为,对任意的正整数jk

\\< 1,cos(kx)> =\frac{1}{\pi}\int_{-\pi}^{\pi}cos(kx)dx \\= \frac{1}{\pi k}\int_{-\pi}^{\pi}cos(kx)d(kx) = \frac{1}{\pi k}(sin(k\pi) - sin(-k\pi))= \frac{1}{\pi k}\cdot 2sin(k\pi) = 0

\\< cos(jx),cos(kx)> =\frac{1}{\pi}\int_{-\pi}^{\pi}cos(jx)cos(kx)dx \\=\frac{1}{2\pi}\int_{-\pi}^{\pi}cos(((j+k)x)+cos((j-k)x))dx = 0

cos(x), cos(2x),\cdots,cos(kx)是单位向量,因为:

\\< cos(kx),cos(kx)> =\frac{1}{\pi}\int_{-\pi}^{\pi}cos(kx)cos(kx)dx \\=\frac{1}{2\pi}\int_{-\pi}^{\pi}(cos(2kx)+1)dx = 1

为了构造一个规范正交基,只要在1的方向上构造单位向量.

\\< 1,1> =\left \| 1 \right \|^2=\frac{1}{\pi}\int_{-\pi}^{\pi}1\cdot dx=2 \\\left \| 1 \right \|=\sqrt{2}

所以,

\begin{Bmatrix} \frac{\sqrt{2}}{2}, & cos(x) & cos(2x), & \cdots & cos(nx) \end{Bmatrix}为一个规范正交的向量集合.


根据以上信息,不求原函数,计算

\int_{-\pi}^{\pi}sin^4xdx

计算过程:

\int_{-\pi}^{\pi}sin^4xdx=\pi\cdot \frac{1}{\pi}\int_{-\pi}^{\pi}sin^4xdx=\pi<sin^2x, sin^2x>=\pi \left \| sin^2x \right \|^2

因为

sin^2x = \frac{1-cos(2x)}{2}=\frac{\sqrt{2}}{2}\cdot \frac{\sqrt{2}}{2}+(-\frac{1}{2})\cdot cos(2x)

所以sin^2x可以表示为正交坐标系中坐标为(\frac{\sqrt{2}}{2}, -\frac{1}{2})^T的点.

\pi \left \| sin^2x \right \|^2=\pi({x_1^2 +x_2^2}) = \pi(\frac{1}{2}+ \frac{1}{4})=\frac{3\pi}{4}

分析:

\\ \int_{-\pi}^{\pi}sin^4xdx=\pi\cdot \frac{1}{\pi}\int_{-\pi}^{\pi}sin^4xdx=\pi\cdot \frac{1}{\pi}\int_{-\pi}^{\pi}(\frac{\sqrt{2}}{2}\cdot \frac{\sqrt{2}}{2}+(-\frac{1}{2})\cdot cos(2x))^2dx=\pi\cdot \frac{1}{\pi}\int_{-\pi}^{\pi}(\frac{\sqrt{2}}{2}\vec{u_1}+(-\frac{1}{2})\vec{u_2})^2dx=\pi\cdot \frac{1}{\pi}\int_{-\pi}^{\pi}(\frac{1}{2}\vec{u_1}^2+\frac{1}{4}\vec{u_2}^2-\frac{\sqrt{2}}{2}\vec{u_1}\vec{u2})dx= \\ \pi \frac{1}{2} <\vec{u_1}, \vec{u_1}> + \pi\frac{1}{4}<\vec{u_2}, \vec{u_2}> +\pi\frac{\sqrt{2}}{2}<\vec{u_1}, \vec{u_2}> = \frac{\pi}{2}+\frac{\pi}{4}+0 = \frac{3\pi}{4}

29:假设在标准坐标系下的正交向量

      \vec{x}=\begin{bmatrix} x_1\\ x_2 \end{bmatrix}

以及

     \vec{y}=\begin{bmatrix}y_1\\ y_2 \end{bmatrix}

\vec{x_1}^T\vec{y_1} = 0

则加入存在新的基(\vec{u_1}, \vec{u_2}),从(\vec{u_1}, \vec{u_2})到标准坐标系的转移矩阵是A

则新的\vec{x'},\vec{y'}的内积是?

\\ \vec{x'} = A^{-1}\vec{x}\\ \vec{y'} = A^{-1}\vec{y'}

所以,\vec{x'}^T\vec{y'} = (A^{-1}\vec{x})^TA^{-1}\vec{y} = \vec{x}{A^{-1}}^TA^{-1}\vec{y}

AA为正交变换时,

{A^{-1}}^TA^{-1}={A^{T}}^TA^{-1} =AA^{-1} = E

所以,

\vec{x'}^T\vec{y'} = (A^{-1}\vec{x})^TA^{-1}\vec{y} = \vec{x}^{T}{A^{-1}}^TA^{-1}\vec{y}=\vec{x}^TE\vec{y} = \vec{x}^T\vec{y}=0

反之,如果A并非正交变换,则结果

\vec{x'}^T\vec{y'} = (A^{-1}\vec{x})^TA^{-1}\vec{y} = \vec{x}{A^{-1}}^TA^{-1}\vec{y}

内积不一定为0!

同样道理,内积为0,不表示这两个向量一定正交垂直,还要看它的坐标系.

比如,二维平面连个无关向量,\vec{u_1},\vec{u_2},其中\vec{u_1}^T\vec{u_2}\neq 0,则以他们为基的坐标点

(1,0)^T(0,1)^T虽然内积为0,但他们并不垂直.

大致可以得到一个结论,要准确描述向量,首先要确定一组基,然后给出在基所在的各个直线上的投影值,就可以了。为了方便求坐标,我们希望这组基向量模长为 1。因为向量的内积运算,当模长为 1 时,内积可以直接表示投影。然后还需要这组基是线性无关的,我们一般用正交基,非正交的基也是可以的,不过正交基有较好的性质。


30:正交矩阵的特征值有什么规律?

 假设A是正交矩阵,则A^{-1}A=A^{T}A=E

  特征值为\lambda,对应特征向量\vec{x}

A\vec{x}=\lambda \vec{x}

两边转置

\vec{x}^TA^T=\lambda\vec{x}^T

同时右乘A\vec{x}

\\ \vec{x}^TA^TA\vec{x}=\lambda\vec{x}^TA\vec{x}=\lambda\vec{x}^T\lambda\vec{x} = \lambda^2\vec{x}^T\vec{x} \\ \vec{x}^T\vec{x}= \lambda^2\vec{x}^T\vec{x}\\ => (\lambda^2-1)\vec{x}^T\vec{x} = 0 =>\lambda^2-1=0=>\lambda =\pm 1

所以,n阶正交矩阵一定相似于

A\Leftrightarrow \begin{bmatrix} \pm 1 & 0 & \cdots & 0 \\ 0 & \pm 1 & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & \pm 1 \end{bmatrix}

意味着

det(A)=\pm 1

由于实对称矩阵的特征值是实数\pm 1,不失一般性,假设是1,所以,齐次线性方程组

(A-E)\vec{x} = \vec{0}

是实系数线性方程组,又由于

\left | A-E\right| = 0

得到

Rank(A-E)<n, 所以其必有非平凡实数解,也就是必有实的基础解系.正交矩阵不但有着实的特征值,其特征向量也是实的。

这个结论有什么意义呢?从这个结论 可以得出,在三维空间中的刚体变换,一定存在一个对称轴,在对称轴方向上,刚体的尺度不发生变化。

31:

AA为一n\times n实矩阵,它有一个复特征值\lambda = a + bi,并令\vec{x}为属于\lambda的一个特征向量,向量\vec{x}可以分解为实部和虚部.

\vec{x}=\begin{bmatrix} Rex_1 +i\cdot Imx_1\\ Rex_2 +i\cdot Imx_2\\ \cdots \\ Rex_n +i\cdot Imx_n \end{bmatrix}=\begin{bmatrix} Rex_1\\ Rex_2\\ \cdots\\ Rex_n \end{bmatrix} + i\cdot \begin{bmatrix} Imx_1\\ Imx_2\\ \cdots\\ Imx_n \end{bmatrix} = Re\vec{x} + i\cdot Im\vec{x}

由于A的元素均为实的,可得\bar{\lambda}=a-bi也是AA的一个特征值,它相应的特征向量为:

\bar{\vec{x}}=\begin{bmatrix} Rex_1 -i\cdot Imx_1\\ Rex_2 -i\cdot Imx_2\\ \cdots \\ Rex_n -i\cdot Imx_n \end{bmatrix}=\begin{bmatrix} Rex_1\\ Rex_2\\ \cdots\\ Rex_n \end{bmatrix} - i\cdot \begin{bmatrix} Imx_1\\ Imx_2\\ \cdots\\ Imx_n \end{bmatrix} = Re\vec{x} - i\cdot Im\vec{x}

e^{\lambda t}\vec{x}e^{\bar{\lambda}t}\bar{\vec{x}}均为一阶方程组Y'=AY的解,这两个解的任意线性组合也将是一个解,

\\ \overline{e^{\lambda t}\vec{x}} = \overline{e^{(a+bi)t}\vec{x}} = \overline{e^{at}e^{bti}\vec{x}} = e^{at}\overline{e^{bti}\vec{x}} = e^{at}\overline{[cos(bt)+isin(bt)]\vec{x}} = \\ \\ e^{at}[cos(bt)-isin(bt)]\overline{\vec{x}}=e^{at}e^{-bti}\overline{\vec{x}} = e^{(a-bi)t}\overline{\vec{x}} = e^{\overline{\lambda}t}\overline{\vec{x}} 

因此,令

\\Y_1=\frac{1}{2}(e^{\lambda t}\vec{x} +e^{\bar{\lambda}t}\bar{\vec{x}})=Re(e^{\lambda t}\vec{x})

Y_2=\frac{1}{2i}(e^{\lambda t}\vec{x} -e^{\bar{\lambda}t}\bar{\vec{x}} )=Im(e^{\lambda t}\vec{x})

\\e^{\lambda t}\vec{x}} = e^{(a+bi)t}\vec{x} = e^{at}[cos(bt)+i sin(bt)](Re\vec{x} + i\cdot Im\vec{x})=\\e^{at}[(cos(bt)Re\vec{x} - sin(bt)Im\vec{x}) + i\cdot (cos(bt)Im\vec{x} + sin(bt)Re\vec{x})]

所以:

\\Y_1=\frac{1}{2}(e^{\lambda t}\vec{x} +e^{\bar{\lambda}t}\bar{\vec{x}})=Re(e^{\lambda t}\vec{x})=e^{at}(cos(bt)Re\vec{x} - sin(bt)Im\vec{x})

Y_2=\frac{1}{2i}(e^{\lambda t}\vec{x} -e^{\bar{\lambda}t}\bar{\vec{x}} )=Im(e^{\lambda t}\vec{x})=e^{at}(cos(bt)Im\vec{x} + sin(bt)Re\vec{x})

32:证明A^TAAA^T具有相同的非零特征值 

  A是一个m \times n的矩阵

  因为A\vec{x}=\vec{0} = >A^TA\vec{x}=A^T\vec{0} = \vec{0},所以A\vec{x}的解同样为A^TA\vec{x} 的解。

  因为\\A^TA\vec{x}=\vec{0}=>\vec{x}^TA^TA\vec{x} = (A\vec{x})^T(A\vec{x}) =0=>\left \| A\vec{x} \right \|=0=>A\vec{x}=\vec{0}

,所以A^TA\vec{x}的解同样也是A\vec{x}的解,所以在R^n空间中,它们具有相同的零空间,所以Rank(A)=Rank(A^TA)

同样道理,Rank(A^T)=Rank(AA^T)

所以:

Rank(A^TA)=Rank(A)=Rank(A^T)=Rank(AA^T)

下面证明,特征值相同:

 设\vec{x}A^TA的特征值\lambda对应的特征向量

A^TA\vec{x} = \lambda\vec{x}=>A\cdot A^TA\vec{x}=A\cdot A^TA\vec{x}=>AA^T(A\vec{x})=\lambda (A\vec{x})

实际上有一个更强的结论,两个矩阵应该是相似的。

QED!

33:

 V_{n\times n}= \begin{bmatrix} v_{11}& v_{12}& \cdots & v_{1n}\\ v_{21}& v_{22}& \cdots & v_{2n}\\ \vdots & \vdots & \ddots & \vdots \\ v_{n1}& v_{n2}& \cdots & v_{nn} \end{bmatrix}=[\vec{v_1}, \vec{v_2}, \cdots, \vec{v_n}]=[V_1, V_2] 

其中

\vec{v_i} = \begin{Bmatrix} v_{1i}\\ v_{2i}\\ \vdots \\ v_{ni} \end{Bmatrix}

V_1 = [\vec{v_1}, \vec{v_2}, \cdots, \vec{v_r}]

V_2 = [\vec{v_{r+1}}, \vec{v_{r+2}}, \cdots, \vec{v_n}]

所以

VV^T =[V_1, V_2][V_1, V_2]^T = [V_1, V_2]\begin{bmatrix} {V_1}^T\\ {V_2}^T \end{bmatrix} = V_1{V_1}^T + V_2{V_2}^T

形式上的确如此,证明一下:

VV^T中的元素k_{ij}

k_{ij} = \sum_{s=1}^{n}v_{is}v_{sj}=\sum_{s=1}^{r}v_{is}v_{sj} + \sum_{m=r+1}^{n}v_{im}v_{mj}=V_1{V_1}^T + V_2{V_2}^T


34.如果当T\vec{u} = T\vec{v},必有\vec{u} = \vec{v},则T:V\rightarrow W是单的,也叫“一对一”的映射。

比如,对于

T=[\vec{t}_1, \vec{t}_2, \cdots, \vec{t}_n]

其中

\vec{t}_i =\begin{bmatrix} t_{1i}\\ t_{2i}\\ \vdots\\ t_{mi} \end{bmatrix}

所以实际上T是一个m\times n的矩阵,而T\vec{u} = T\vec{v}是单的等价于方程组

T\vec{x}=\vec{b}有唯一解.

如果m\geq n,则表示方程数目大于未知量的数目,相当于从低维空间映射到高维空间,则在系数无关的情况下必定有唯一解或者无解,所以,可能是单的。

但如果m\leq n,则表示方程数目小于未知量数目,相当于从高维空间映射到低维空间,必然有多个非零解,所以,不可能是单的。

例如,对于映射:

T=\begin{bmatrix} 1 & 3\\ 2 & 5\\ 4 & 1 \end{bmatrix}

他是将二维坐标映射到三维坐标,是升维度映射,所以是单射,从下图可以看到,左边二维空间映射为右边三维空间的二维子空间,映射后的空间构成一个平面,仍然是二维的。


对偶空间:

T=\begin{bmatrix} 1 & 3\\ 2 & 5\\ 4 & 1 \end{bmatrix}

V->W的线性映射,VR^2空间,WR^3空间。

 则:

 T(\vec{x})=T(x_1\vec{e}_1 + x_2\vec{e}_2) = x_1T(\vec{e}_1) + x_2T(\vec{e}_2)=\begin{bmatrix} 1\cdot x_1 +3\cdot x_2\\ 2\cdot x_1 + 5 \cdot x_2 \\ 4 \cdot x_1 + 1\cdot x_2 \end{bmatrix}=\begin{bmatrix} \vec{e}_1 &\vec{e}_2 & \vec{e}_3 \end{bmatrix}\begin{bmatrix} 1\cdot x_1 +3\cdot x_2\\ 2\cdot x_1 + 5 \cdot x_2 \\ 4 \cdot x_1 + 1\cdot x_2 \end{bmatrix}

M(T)=\begin{bmatrix} T(\vec{e}_1) & T(\vec{e}_2) \end{bmatrix} =\begin{bmatrix} 1 & 3\\ 2 & 5\\ 4 & 1 \end{bmatrix}

V'的基是 

f_{v'}^1 (\begin{bmatrix} x\\ 0 \end{bmatrix}) = x

f_{v'}^2 (\begin{bmatrix} 0\\ y \end{bmatrix}) = y

W'的基是 

f_{w'}^1 (\begin{bmatrix} x\\ 0\\0 \end{bmatrix}) = x

f_{w'}^2 (\begin{bmatrix} 0\\ y\\0 \end{bmatrix}) = y

f_{w'}^3 (\begin{bmatrix} 0\\ 0\\z \end{bmatrix}) = z

所以,对于W'->V'的映射T'

35.设A为n阶对称矩阵,\lambda是A的特征方程的r重根,则矩阵A-\lambda E的秩Rank(A-\lambda E)=n-r,从而对应特征值\lambda恰好有r线性无关的特征向量.

猜你喜欢

转载自blog.csdn.net/tugouxp/article/details/109325723
今日推荐