范数
范数实际上就是定义了一种距离(将向量映射为非负值的标量), 范数的数学定义为
范数满足以下三个性质:
①
②(三角不等式)
③
范数:当时,范数称为欧几里得范数,表示向量的欧几里得距离。并且
范数的平方在计算上比范数更方便,范数对向量中每个元素的导数与整个向量有关,而范数的平方则只取决于对应的元素。
范数的平方当向量离原点很近时,其变化是十分缓慢的。
范数:当机器学习问题只0和非0元素之间的差异非常重要时,范数会是很有用的范数
范数:也称为最大范数,表示向量中具有最大幅值的元素的绝对值
Frobenius范数:有时需要衡量矩阵的大小,深度学习中常用Frobenius范数
特征分解
称为方阵的特征向量,称为方阵的特征值。
如果矩阵有n个线性无关的特征向量{ ,...,},对应的特征值为{ ,...,},另矩阵,向量,那么的特征分解为
若是实对称矩阵,可以对其正交分解
是正交矩阵。
奇异值分解
假设是的矩阵,则可以分解成三个矩阵的乘积:
其中,是的正交矩阵,其列向量称为左奇异向量,是的正交矩阵,其列向量称为右奇异向量,是的对角矩阵,其对角线上的元素称为矩阵的奇异值。
如何进行奇异值分解?令,则是一个实对称矩阵,可以对其正交分解得到矩阵,左奇异向量对应的特征向量;令,则是一个实对称矩阵,可以对其正交分解得到矩阵,右奇异向量对应的特征向量。
Moore-Penrose伪逆
假设是的矩阵,其Moore-Penrose伪逆满足,,可以通过下面公式求得:
对角矩阵的伪逆是其非零元素倒数之后再转置得到的。
对于线性方程组,当列数多于行数时,可以使用伪逆求得一个解,该解是方程所有可行解中欧几里得范数最小的一个。当行数多于列数时,方程可能没有解,在这种情况下,通过伪逆得到的使得和的欧几里得距离最小。
迹运算
迹运算表示矩阵对角元素的和,即
可以用迹运算表示矩阵的Frobenius范数
多个矩阵相乘的迹与其相乘的顺序无关