前言
本文只会记录人工智能中所用到的线性代数知识,并不会记录大学线性代数教材中的所有知识。
只会介绍向量和矩阵、特征向量和特征值以及矩阵分解。
标量
只有大小没有方向的量称为标量。
单个数字就是标量。
向量
所谓的向量就是一组数字,可以用
v来表示
v=⎣⎡123⎦⎤ 或
v=[1 2 3]
当两个向量大小相等、方向相同时,说这两个向量相等。
这里由3个数组成,叫做3维向量,相应的,由n个数组成的称为n维向量。
左边排成一列的形式叫做列向量;右边叫做行向量
vi表示向量中的第
i个元素,本例中
v1=1,v2=2,v3=3
3维向量可以在3维空间中表示出来。
向量的长度
n维向量
α=(a1,a2,...,an),数值
a12+a22+...+an2
称为向量
α的长度或模,记为
∥α∥
∥α∥=1 称
α为单位向量。
向量的运算
向量的加法:
向量的减法:
注意
a
−b
得到的向量为
b
指向
a
。
向量的乘法:
a
⋅b
=∣a
∣⋅∣b
∣cosθ
相当于向量
b
在向量
a
的方向的投影与向量
∣a
∣相乘
向量的范数
向量的1-范数:
∥X∥1=∣x1∣+∣x2∣+...+∣xn∣ ;各元素的绝对值之和
向量的2-范数:
∥X∥=x12+x22+...+xn2
; 每个元素的平方和再开方,也就是n维向量的长度;
向量的无穷范数:
∥X∥∞=max(∣x1∣,∣x2∣,...,∣xn∣) ;分量绝对值的最大者
向量的p-范数:
∥X∥p=(∑i=1n∣xi∣p)p1,(1≤p≤n)
对于2-范数有:
∣∣x∣∣+∣∣y∣∣≥∣∣x+y∣∣
当
∣∣x
∣∣ ≠
0 ,
∣∣y
∣∣ ≠
0 时,称
θ=arccos∣∣x
∣∣∣∣y
∣∣a
⋅y
为向量
x
与
y
的夹角。
向量的内积
设有n维向量
x
=⎣⎢⎢⎢⎡x1x2⋮xn⎦⎥⎥⎥⎤,y
=⎣⎢⎢⎢⎡y1y2⋮yn⎦⎥⎥⎥⎤,
令
[x
,y
]=∑i=1nxiyi=x1y1+x2y2+⋯+xnyn
上式称为向量的内积,内积的结果是一个标量。
这里要求一维向量
x
和向量
y
的行列数相同。
当
[x
,y
]=0时,称向量
x
和向量
y
正交。
一组两两相交的非零向量,称为正交向量组。
向量组
若干个同维的列向量(行向量)所组成的集合称为向量组。
如
a1
,a2
,a3
,⋯,an
⎣⎢⎢⎢⎡a11a12⋮a1na21a22⋮a2n⋯⋯⋱⋯am1am2⋮amn⎦⎥⎥⎥⎤
向量组的线性组合:
对于向量组
a1
,a2
,a3
,⋯,an
,如果有一组数
k1,k2,⋯,kn,使
β
=k1a1
+k2a2
+⋯+knan
,
则称向量
β
是向量组
a1
,a2
,a3
,⋯,an
的一个线性组合,或称
β
可由向量组
a1
,a2
,a3
,⋯,an
线性表示。
向量组的线性相关:
给定向量组
A=a1
,a2
,a3
,⋯,an
,如果存在不全为零的数
k1,k2,⋯,kn使
k1a1
+k2a2
+⋯+knan
=0
则称向量组
A是线性相关的,否则称它为线性无关。
对于任一向量组,不是线性无关就是线性相关。
向量空间
设
V是
n维实向量构成的集合,对于向量的加法运算及数乘运算满足:
- 任意
α∈V,β∈V,有
α+β∈V;
- 任意
α∈V,k∈R,有
kα∈V
则称集合
V为
R上的实向量空间,简称向量空间。
已知
V1,V2是向量空间,若
V1∈V2,则称
V1是
V2的子空间。
向量空间的基
设
V是一个向量空间,如果存在一组向量
α1,α2,⋯,αr∈V,满足:
-
α1,α2,⋯,αr线性无关;
-
V中任意一组向量都可以由该向量组线性表示,则称
α1,α2,⋯,αr为向量空间
V的一组基;
矩阵
矩阵是一个按照长方阵列排列的复数或实数集合。
由
m×n个数组成的一个
m行
n列的矩形表格,组成矩阵的每一个数,均称为矩阵的元素。如图所示:
A=⎣⎢⎢⎢⎡a11a21⋮am1a12a22⋮am2⋯⋯⋱⋯a1na2n⋮amn⎦⎥⎥⎥⎤
单位矩阵:从左上角到右下角的对角线(称为主对角线)上的元素均为1。除此以外全都为0,如:
⎣⎡100010001⎦⎤
矩阵的基本运算
两个矩阵的行数和列数分别相等,称它们为同型矩阵。
加法
矩阵的加法只能在两个同型矩阵之间进行,两个矩阵相加时,对应元素进行相加。
如:
[142537]+[020123]=[1626510]
数乘
数
λ与矩阵
A的乘积记作
λA或
Aλ,规定为
λA=Aλ=⎣⎢⎢⎢⎡λa11λa21⋮λam1λa12λa22⋮λam2⋯⋯⋱⋯λa1nλa2n⋮λamn⎦⎥⎥⎥⎤
乘法
必须满足矩阵
A的列数与矩阵
B的行数相等,或者矩阵
A的行数与矩阵
B的列数相等。
记
C=AB,矩阵
C的第
i行第
j列的元素等于矩阵
A的第
i行的所有元素与矩阵
B的第
j列的对应元素的乘积之和,即:
Cij=k=1∑naikbkj
如:
[123]1×3⎣⎡456⎦⎤3×1=1×4+2×5+3×6=32
⎣⎡123⎦⎤3×1[456]1×3=⎣⎡48125101561218⎦⎤3×3
矩阵的乘法不满足交换律
转置
矩阵
A的转置矩阵,记作
AT,是将
A的行列互换后所得矩阵,如果
A是一个
m×n阶矩阵,
AT是一个
n×m阶矩阵。
A=⎣⎡123456⎦⎤AT=[142536]
矩阵的转置的性质:
-
(AT)T=A
-
(A+B)T=AT+BT
-
(λA)T=λAT
-
(AB)T=BTAT
逆矩阵
设
A为
n阶方阵(
n×n),若存在
n阶方阵
B使得:
AB=BA=E(单位矩阵),则称
A是可逆的且矩阵
B是矩阵
A的逆矩阵,记为
A−1=B
矩阵的秩
矩阵的秩等于行向量组或列向量组最大线性无关组所包含的向量的个数。(矩阵的所有不等于零的子式的最高阶数称为矩阵的秩)
矩阵的特征值和特征向量
设
A是
n阶矩阵,如果数
λ和
n维非零列向量
x使关系式
Ax=λx
成立,
λ称为方阵
A的特征值,非零向量
x称为
A的对应于特征值
λ的特征向量。
方阵
A的特征值,就是使齐次线性方程组
(A−λE)x=0有非零解的
λ值,
即满足方程
∣A−λE∣=0的
λ都是矩阵
A的特征值。
相似矩阵
设
A,B都是
n阶矩阵,若有可逆矩阵
P,使
P−1AP=B,
则称
B是
A的相似矩阵,或说矩阵
A与
B相似。