观看B站视频【工程数学基础】1_特征值与特征向量所作的笔记。
1.特征值与特征向量
对于一个给定的线性变换 A \color{blue}A A,它的特征向量 v \color{blue}v v 经过这个线性变换的作用之后,得到的新向量仍然与原来的 v \color{blue}v v 保持在同一直线上,但是其长度或方向也许会改变,即:
A v = λ v (1) \color{blue}Av=\lambda v \tag{1} Av=λv(1)
其中, λ \color{blue}\lambda λ是标量,即特征向量的长度在该线性变换下缩放的比例,称其为 特 征 值 \color{red}特征值 特征值。
A v = λ v \color{blue}Av=\lambda v Av=λv
等价于:
( A − λ I ) v = 0 (2) \color{blue}(A-\lambda I )v=0 \tag{2} (A−λI)v=0(2)
根据矩阵的理论,如果要使上面的等式有非零解,必须满足:
∣ A − λ I ∣ = 0 (3) \color{blue}|A-\lambda I |=0 \tag{3} ∣A−λI∣=0(3)
解出上式就得到了特征值 λ \color{blue}\lambda λ 和特征向量 v \color{blue}v v。
2.矩阵特征值与特征向量的一个重要的应用就是:把矩阵化为对角矩阵,它起到一个解耦的作用。
例子:
A = [ 1 1 4 − 2 ] A=\begin{bmatrix}1&1\\ 4 & -2\\ \end{bmatrix} A=[141−2]
可以求得矩阵 A A A的的特征值为 λ 1 = 2 \lambda_1=2 λ1=2, λ 2 = − 3 \lambda_2=-3 λ2=−3
对应的特征向量分别为:
v 1 = [ v 11 v 12 ] = [ 1 1 ] v1=\begin{bmatrix} v11\\v12\\ \end{bmatrix}=\begin{bmatrix} 1\\1\\ \end{bmatrix} v1=[v11v12]=[11] 和 v 2 = [ v 21 v 22 ] = [ 1 − 4 ] v2=\begin{bmatrix} v21\\v22\\ \end{bmatrix}=\begin{bmatrix} 1\\-4\\ \end{bmatrix} v2=[v21v22]=[1−4] 。
P = [ v 1 v 2 ] \color{blue}P=\begin{bmatrix} v1\ v2\\ \end{bmatrix} P=[v1 v2]是一个过滤矩阵,那么:
A P = A [ v 1 v 2 ] = A [ v 11 v 21 v 12 v 22 ] = [ A [ v 11 v 12 ] A [ v 21 v 22 ] ] = [ λ 1 [ v 11 v 12 ] λ 2 [ v 21 v 22 ] ] = [ λ 1 v 11 λ 2 v 21 λ 1 v 12 λ 2 v 22 ] = [ v 11 v 21 v 12 v 22 ] [ λ 1 0 0 λ 2 ] = P Λ \quad AP \\\quad\\ = A\begin{bmatrix} v1\ \quad v2\\ \end{bmatrix} \\\quad\\ =A\begin{bmatrix} v11&v21\\ v12 & v22\\ \end{bmatrix} \\\quad\\ = \begin{bmatrix} A\begin{bmatrix}v11\\v12 \end{bmatrix} \quad A \begin{bmatrix}v21 \\ v22\\ \end{bmatrix}\end{bmatrix} \\\quad\\ = \begin{bmatrix} \lambda_1\begin{bmatrix}v11\\v12 \end{bmatrix} \quad \lambda_2\begin{bmatrix}v21 \\ v22\\ \end{bmatrix}\end{bmatrix} \\\quad\\ =\begin{bmatrix} \lambda_1 v11& \lambda_2v21\\ \lambda_1v12 & \lambda_2v22\\ \end{bmatrix} \\\quad\\ =\begin{bmatrix} v11&v21\\ v12 & v22\\ \end{bmatrix} \begin{bmatrix} \lambda_1&0\\ 0 & \lambda_2\\ \end{bmatrix} \\\quad\\ =P \Lambda AP=A[v1 v2]=A[v11v12v21v22]=[A[v11v12]A[v21v22]]=[λ1[v11v12]λ2[v21v22]]=[λ1v11λ1v12λ2v21λ2v22]=[v11v12v21v22][λ100λ2]=PΛ
这样就得到了:
A P = P Λ (4) \color{blue}AP=P \Lambda \tag{4} AP=PΛ(4)
等式都左乘 P − 1 \color{blue}P^{-1} P−1,得到:
P − 1 A P = Λ (5) \color{blue}P^{-1}AP= \Lambda \tag{5} P−1AP=Λ(5)
3.在控制理论的状态空间中的运用:
在现代控制理论当中,状态空间的方程,是由一些微分方程组组成的。
{ d x 1 d t = x 1 + x 2 d x 2 d t = 4 x 1 − 2 x 2 (7) \begin{cases} \frac{dx_1}{ dt} = x_1 + x_2\\\\ \frac{dx_2}{ dt} = 4x_1 - 2x_2 \tag{7} \end{cases} ⎩⎪⎨⎪⎧dtdx1=x1+x2dtdx2=4x1−2x2(7)
上面的微分方程组可以写成如下形式:
d d t [ x 1 x 2 ] = [ 1 1 4 − 2 ] [ x 1 x 2 ] (8) \frac{d}{dt}\begin{bmatrix} x1\\ x2\\ \end{bmatrix} = \begin{bmatrix} 1&1\\ 4& -2\\ \end{bmatrix} \begin{bmatrix} x1\\ x2\\ \end{bmatrix}\tag{8} dtd[x1x2]=[141−2][x1x2](8)
上式可以写成状态空间的表达形式:
x ˙ = A x (9) \dot x=Ax \tag{9} x˙=Ax(9)
令:
x = P y (10) x=Py\tag{10} x=Py(10)
那么:
x ˙ = P y ˙ (11) \dot x=P \dot y\tag{11} x˙=Py˙(11)
对(11)左右乘 A A A 得到:
A x = A P y (12) Ax=APy \tag{12} Ax=APy(12)
又因为对角矩阵
Λ = [ λ 1 0 0 λ 2 ] = [ 2 0 0 − 3 ] \Lambda= \begin{bmatrix} \lambda_1&0\\ 0 & \lambda_2\\ \end{bmatrix} = \begin{bmatrix} 2&0\\ 0 & -3\\ \end{bmatrix} Λ=[λ100λ2]=[200−3]
P = [ v 1 v 2 ] = [ 1 1 1 − 4 ] P=\begin{bmatrix} v1\ v2\\ \end{bmatrix}= \begin{bmatrix} 1&1\\ 1 & -4\\ \end{bmatrix} P=[v1 v2]=[111−4]
根据式子(9)(11)(12)得到,
P y ˙ = A P y (13) P \dot y = APy \tag{13} Py˙=APy(13)
上式乘以 P − 1 P^{-1} P−1得到:
y ˙ = P − 1 A P y (14) \dot y = P^{-1}APy \tag{14} y˙=P−1APy(14)
又因为(5)式 P − 1 A P = Λ \color{blue}P^{-1}AP= \Lambda P−1AP=Λ,(14)就变为:
y ˙ = Λ y (15) \dot y = \Lambda y \tag{15} y˙=Λy(15)
于是,有
y ˙ = [ 2 0 0 − 3 ] y (16) \dot y = \begin{bmatrix} 2&0\\ 0 & -3\\ \end{bmatrix} y \tag{16} y˙=[200−3]y(16)
那么:
{ y ˙ 1 = 2 ∗ y 1 y ˙ 2 = − 3 ∗ y 2 (17) \begin{cases} \dot y_1 = 2*y_1 \\ \dot y_2 = -3*y_2 \\ \end{cases} \tag{17} {
y˙1=2∗y1y˙2=−3∗y2(17)
根据微分方程的解法:得到:
{ y 1 = C 1 ∗ e 2 t y 2 = C 2 ∗ e − 3 t (18) \begin{cases} y_1 = C_1*e^{2t} \\ y_2 = C_2*e^{-3t} \tag{18} \end{cases} {
y1=C1∗e2ty2=C2∗e−3t(18)
其中, C 1 C_1 C1 、 C 2 C_2 C2为常数。
把上面结果带入(10) 式 x = P y \color{blue}x=Py x=Py, 那么:
x = P y = [ 1 1 1 − 4 ] [ C 1 ∗ e 2 t C 2 ∗ e − 3 t ] = [ C 1 ∗ e 2 t + C 2 ∗ e − 3 t C 1 ∗ e 2 t − 4 C 2 ∗ e − 3 t ] (19) x=Py =\begin{bmatrix} 1&1\\ 1 & -4\\ \end{bmatrix} \begin{bmatrix} C_1*e^{2t}\\ C_2*e^{-3t}\\ \end{bmatrix} \\\quad\\ =\begin{bmatrix} C_1*e^{2t}+C_2*e^{-3t} \\\quad\\ C_1*e^{2t}-4C_2*e^{-3t}\\ \end{bmatrix} \tag{19} x=Py=[111−4][C1∗e2tC2∗e−3t]=⎣⎡C1∗e2t+C2∗e−3tC1∗e2t−4C2∗e−3t⎦⎤(19)
这就是我们用特征值与特征向量的方法来解微分方程组。