主要内容
- 矩阵
- 特征值和特征向量
- 矩阵求导
矩阵
SVD的提法
-
奇异值分解(Singular Value Decomposition)是一种重要的矩阵分解方法,可以看做对称方阵在任意矩阵上的推广。
-
假设A是一个(m imes n)阶实矩阵,则存在一个分解使得:
- 通常将奇异值从大到小排列,这样(sum)就能由A唯一确定了。
-
与特征值、特征向量的概念相对应
- (sum)在对角线上的元素称为矩阵A的奇异值;
- U的第i列称为A的关于的左奇异向量;
- V的第i列称为A的关于的右奇异向量。
例子:
线性代数
方阵的行列式
-
一阶方阵的行列式为该元素本身
-
n阶方阵的行列式等于它的任意行(或列)的各元素与其对应的代数余子式乘积之和
-
(2 imes 2)的方阵
代数余子式
在n阶行列式D中划去任意选定的k行、k列后,余下的元素按原来顺序组成的n-k阶行列式M,称为行列式D的k阶子式A的余子式。如果k阶子式A在行列式D中的行和列的标号分别为i1,i2,…,ik和j1,j2,…,jk。则在A的余子式M前面添加符号:
后,所得到的n-k阶行列式,称为行列式D的k阶子式A的代数余子式。
伴随矩阵
对于(n imes n)方阵的任意元素(a_{ij})都有各自的代数余子式(A_{ij}=(-1)^{i+j}M_{ij}),构造(n imes n)的方阵(A^*);
(A^*)是A的伴随矩阵。
方阵的逆
范德蒙行列式Vandermonde
范德蒙行列式:
第n行是(x_1,x_2,...,x_n)的n-1次幂。
如果我们能使得(x_1,x_2,...,x_n)互不相等,那么矩阵(D)不为0,则存在(D^{-1})
矩阵的乘法
A为(m imes s)阶矩阵,B为(s imes n)阶的矩阵,那么,(C=A imes B)是(m imes n)阶的矩阵,其中:
矩阵模型
考虑随机过程(pi),它的状态有n个,用1~n表示。记在当前时刻t时刻时位于i状态,它在t+1时刻处于j状态的概率为P(i,j)=P(j|i)。
即状态转移的概率只依赖于前一个状态
(思考马尔可夫过程?)
举例:
假定按照经济状况将人群分为上中下三个阶层,用123表示。假定当前处于某阶层只和上一代有关,即,考察父代为第i阶层,则子代为第j阶层的概率。假定为如下转移概率矩阵:
图解为:
概率转移矩阵
第n+1代处于第j个阶层的概率为:
矩阵P即为(条件)概率转移矩阵。
第i行元素表示,在上一状态为i时的分布概率,每一行元素的和为1.
那么思考:初始概率分布对最终分布的影响?
Think!
初始概率(pi =[0.21,0.68,0.1])迭代
初始概率(pi =[0.75,0.15,0.1])迭代
平稳分布
初始概率不同,但经过若干次迭代,(pi)最终稳定收敛在某个分布上。这是转移概率矩阵P的性质,而非初始分布的性质。
上例中,矩阵P的n次幂,每行都是,这实际上就是特征向量。
如果一个非周期马尔可夫随机过程具有转移概率矩阵P,且它的任意两个状态都是连通的,则存在,记作。
In Fect,下面两种写法等价:
同时,若某概率分布(pi P=pi),说明
- 该多项分布是状态转移矩阵P的平稳分布;
矩阵和向量的乘法
矩阵和向量的乘法应用
矩阵的秩
在(m imes n)矩阵A中,任取k行k列,不改变这(k^2)个元素在A中的次序,得到k阶方阵,称为矩阵A的k阶子式。
设在矩阵A中有一个不等于0的r阶子式D,且所有r+1阶子式(如果存在)全等于0,那么,D称为A的最高阶非零子式,r称为A的秩,记作R(A)=r
秩与线性方程组解的关系
推论
- Ax=0有非零解的充要条件是R(A)<n
- Ax=b有解的充要条件是R(A)=R(A,b)
向量组等价
系数矩阵
将向量组A,B所构成的矩阵依次记作(A(a_1,a_2,...,a_m))和(B(b_1,b_2,...,b_m)),B组能由A组线性表示,即对于每个向量(b_i),存在(k_{1j},k_{2j},...,k_{mj})
使得:
从而得到系数矩阵K
对C=AB的重新认识
由上,若(C= A imes B),则矩阵C的列向量由A的列向量线性表示,B即为这一表示的系数矩阵;C同样由B的行向量线性表示,A为这一表示的系数矩阵。
向量组(B:b_1,b_2,...,b_n)能由向量组(A:a_1,a_2,...,a_n)线性表示的充要条件是矩阵(A=(a_1,a_2,...,a_n))的秩等于矩阵((A,B)=(a_1,a_2,...,a_n,b_1,b_2,...,b_n))的秩。
正交阵
若n阶矩阵A满足(A^TA=I),称A为正交矩阵,简称正交阵。
I为对角线为1,其他为0的矩阵
A是正交阵,x为向量,则Ax称作正交变换。
正交变换不改变向量长度。
特征值和特征向量
A是n阶矩阵,若数(lambda)和n纬非0列向量x满足(Ax=lambda x),那么数(lambda)称为A的特征值,x称为对应于特征值的特征向量。
特征值的性质
设n阶矩阵(A(a_{ij}))的特征值为(lambda_1,lambda_2,...,lambda_n),则:
(lambda_1+lambda_2+...+lambda_n=a_{11}+a_{22}+...+a_{nn})
(lambda_1lambda_2...lambda_n=|A|)
矩阵A主对角线行列式的元素和,称作矩阵A的迹
不同特征值对应的特征向量
-
不同特征值对应的特征向量,线性无关。
-
若方阵A是对称阵,结论是否加强?
引理
实对称阵的特征值是实数
应用:
将实数(lambda)带入方程组((A-lambda I)x=0),该方程组为实系数方程组,因此,实对称阵的特征向量可以取实向量。
实对称阵的不同特征值的特征向量正交
令实对称阵为A,其两个不同的特征值(lambda_1 lambda_2)对应的特征向量分别是(mu_1mu_2);
最终结论
正定阵
对于n阶方阵A,若任意n阶向量x,都有(x^TAx>0)则称A是正定阵。
若条件变为(x^TAxge0),则A称作半正定阵。
类似的还有负定阵,半负定阵。
给定任意(m imes n)的矩阵A,证明(A^TA)一定是半正定阵。
正定阵的判定
- 对称阵A为正定阵;
- A的特征值都为正;
- A的顺序主子式大于0;
- 以上三个命题等价。
例题:
定义证明:
向量的导数
A为(m imes n)的矩阵,x为(n imes1)的列向量,则Ax为(m imes1)的列向量,记为:
推导
令:
从而:
结论与直接推广
注意
关于列向量求导,资料中有如下方案:
以上公式将会导致向量间求导得到“超越矩阵”-矩阵的每个元素仍然是一个矩阵,不利于应用。
标量对向量的导数
推导公式: