人工智能必备数学基础:线性代数基础(1)

 

如果需要小编其他数学基础博客,请移步小编的GitHub地址

  传送门:请点击我

  如果点击有误:https://github.com/LeBron-Jian/DeepLearningNote

   这里我打算再补充一下关于线性代数的基础。

  (注意:目前自己补充到的所有知识点,均按照自己网课视频中老师课程知识点走的,同时一些公式是网友辛辛苦苦敲的,这里用到那个博客均在文末补充地址,不过这里首先表示感谢!!)

1,行列式

1.1  行列式的定义

  行列式在数学中,是一个函数,其定义域为det的矩阵A,取值为一个标量,写作 det(A) 或 |A|。无论是在线性代数,多项式理论,还是微积分学中(比如换元积分法),行列式作为基本的数学工具,都有着重要的应用。

  下面先看看二次线性方程组的求解:

  当  a11a22  - a12a21 ≠ 0 方程组有唯一解:

  我们看行列式,发现其好像有点规律:

  表达式 a11a22  - a12a21 即为二阶行列式。

  其中 aij (i=1,2;j=1,2) 称为元素。 i 代表行标, j 代表列标。

  三阶行列式如下:

  所以可以得到行列式的定义为:n阶行列式是由 n 阶方阵形式的 n2 个数 aij(i,j=1,2,...n)确定的一个数,其值为 n!项之和。若n阶方阵A=(aij),则A相应的行列式D记为:D=|A|=detA=det(aij);若矩阵A相应的行列式D=0,称A为奇异矩阵,否则称为非奇异矩阵。

  下面尝试计算一个三阶行列式,根据如上算法,计算过程如下:

1.2  行列式的性质

  • 1,行列式A中某行(或者列)用同一数 k 乘,其结果等于 kA
  • 2,行列式A等于其转置行列式AT(AT的第i行为A的第i列)
  • 3,若 n 阶行列式 |aij| 中某行(或列);行列式则 |aij| 是两个行列式的和,这两个行列式的第 i 行(或列),一个是 b1, b2,...bn,另一个是 c1, c2,...cn,其余各行(或列)上的元与 |aij| 的完全一样
  • 4,行列式A中两行(或列)互换,其结果等于-A
  • 5,把行列式A的某行(或列)中各元同乘一数后加到另一行(或列)中对应元上,结果仍然是A

1.3  矩阵与数据之间的关系

  我们学习矩阵的目的,最终是要应用到机器学习,而不是单纯的学习数学推导,下面看矩阵和数据之间关系。

  比如A,B,C,D 代表四座城市,他们之间可通行的关系为:

  如果有表格的形式表示,则表示如下:

2,矩阵

2.1  矩阵的定义

  在数学中,矩阵(Matrix)是一个按照长方阵列排列的复数或实数集合,最早来自于方程组的系数及常数所构成的方阵,这一概念由19世纪英国数学家凯里首先提出。

  何谓矩阵就是输入的数据就是矩阵,对数据做任何的操作都是矩阵的操作。

  定义:矩阵是由行和列组成的,即 m*n 个数 aij 排成 m 行 n 列 的表格称为矩阵,简记为 A,或者(aijm*n若 m = n,则称A是 n 阶矩阵或 n 阶方阵,矩阵如下:

  元素是实数的矩阵称为实矩阵,元素是复数的矩阵称为复矩阵

矩阵的特殊形式

  行向量和列向量

  n阶矩阵(n阶方阵):n阶方阵就是行和列一样,即 m=n,我们称A为 n 阶矩阵或 n 阶方阵:

  三角矩阵(上三角矩阵与下三角矩阵):在线性代数中,三角矩阵是方形矩阵的一种,因其非零系数的排列呈三角形状而得名。三角矩阵分为上三角和下三角。若i>j,则 uij=0的矩阵称为上三角矩阵;若i<j,则 uij=0的矩阵称为下三角矩阵。

  对角阵与单位矩阵:(对角矩阵是对于m*m的居住,当i!=j时,有aij=0,此时所有非对角线上的元素均为0,此时的矩阵称为对角矩阵,当对角线的元素为1时,称为单位矩阵。)

  同型矩阵:两个矩阵行列数相同的时候:

  在同型的前提下,并且各个元素相等,这就是矩阵相等了:

  对称矩阵:如果满足 AT = A ,那么 A就是对称矩阵。

   如下行列式,均为对称矩阵:

2.2   矩阵的线性运算

  矩阵运算在科学计算中非常重要,而矩阵的基本运算包括矩阵的加法,减法,数乘,转置,共轭和共轭转置。

  下面通过两个 m*n 的矩阵来看一下其基本运算: A = (aij),B = (bij)

矩阵的加减法

  设 A = (aij) ,B = (bij) 是两个 m*n 矩阵,则 m*n 矩阵 C = (cij) = aij  + bij ,称为矩阵 A 和 B 的和,记为 A + B = C。

  矩阵的加法满足以下运算律(A,B,C都是同型矩阵):

  应该注意的是只有同型矩阵之间才可以进行加法。

矩阵的数乘

  设 A = (aij) 是 m*n 矩阵,k 是一个常数,则 m*n 矩阵 (kaij) 称为数 k 与矩阵 A 的数乘,记为  kA ,如下:

  矩阵的数乘满足以下运算律:

  矩阵的加减法和矩阵的数乘合成矩阵的线性运算。

 2.3  矩阵的转置

  矩阵的转置就是行和列互相交换所产生的矩阵,记做AT,如下:

  矩阵的转置有如下性质:

2.4 矩阵的逆

  有关 A-1 的结论:

   分块求逆公式:

  这里 A, B 均为可逆方阵。

2.5  矩阵的秩

  对于一个 S*N 的矩阵:

  矩阵 A 的每一行可以看作一个 N 维向量:

  α1, α2, ... αs 叫做 A 的行向量。

  矩阵 A的每一列可以看作一个 S 维向量:

  β1, β2, ... βn 叫做 A的列向量。

  矩阵的秩表示什么呢?

  对于下面的A矩阵:

  行向量为:

  求其极大线性无关组假设有:

  则:

  解得: k1 = k2 = k3 = 0,即 α1, α2, α3  线性无关。

  由于含有零向量,必线性相关,所以向量组α1, α2, α3 ,α4 的秩为 3。

  对于列向量同理可得:

  但是 β1, β2,  β3 ,  β的秩为3。

  矩阵的行秩 = 矩阵的列秩

  那么秩该如何理解呢?

  可以对二维图像进行旋转,比如用旋转矩阵:

  变换后的矩阵依然是二维的,所以旋转矩阵的秩为2,如下图:

  或者对于下面的矩阵:

  变换后的矩阵为一维的,所以矩阵的秩为1,如下图:

  矩阵中最大不相关向量的个数就是秩,比如相册里有很多张图片(N),但是只有三个类(R),我们就把 R 当做矩阵的秩。

有关矩阵秩的结论:

2.6  矩阵的乘法

  设 A = (aij) 是 m*n 矩阵,B = (bij) 是 n*s 矩阵,那么 m*s 矩阵 C  = (cij) ,Cij 称为 AB 的乘积,记为 C = AB 。(注意两个矩阵的乘法仅当第一个矩阵A的列数和另一个矩阵B的行数相等时才能定义)

  其中:

  矩阵乘法有如下的运算规则(注意:矩阵乘法不满足交换律)包括左分配律,右分配律,结合律:

  举个例子:有两个商场,三种电视机,求两个商场的销售额?(注意:A的列数要与B的函数相等)

  注意:矩阵乘法没有交换律

  举个简单的例子,当我们交换的时候,会出现下面结果:

2.7   行列式与矩阵的区别

  行列式与矩阵的区别:

  具体区别如下:

  1,运算结果不同

  矩阵是一个表格行数和列数可以不一样;而行列式是一个数,且行数必须等于列数。只有方阵才可以定义它的行列式,而对于长方阵不能定义它的行列式。

  两个矩阵相等是指对应元素都相等;两个行列式相等不要求对应元素都相等,甚至阶数也可以不一样,只要运算代数和的结果一样就可以了。

  2,运算方式不同

  两矩阵相加是将各对应元素相加;两行列式相加,是将运算结果相加,在特殊情况下(比如有行或列相同),只能将一行(或列)的元素相加,其余元素照写。

  3,性质不同

  数乘矩阵是指该数乘以矩阵的每一个元素;而数乘行列式,只能用此数乘行列式的某一行或列,提公因数也如此。

  两矩阵相等指两同型矩阵的对应元素相等;两行列式相等指只要其值相等,不要求它们是同阶行列式,也不要求对应元素相等

  4,变换后的结果不同

  矩阵经初等变换,其秩不变;行列式经初等变换,其值可能改变;换法变换要变好,倍法变换差被数,消法变换不改变。

2.8   矩阵方程

  矩阵方程如何做呢?

  如下:A是系数矩阵,X是未知数矩阵,B是常数矩阵

  矩阵方程是未知数为矩阵的方程,对于矩阵方程,当系数矩阵为方阵时,先判断是否可逆。如果可逆,则可以利用左乘或者右乘逆矩阵的方法求出未知矩阵,如果方阵不可逆或系数矩阵不是方阵,则需要用矩阵的广义逆来确定矩阵方程有界的条件,进而在有解的情况下求出通解。

3,向量

3.1  向量的定义

  在数学中,向量(也称为欧几里得向量,几何向量,矢量),指具有大小(magnitude)和方向的量。它可以形象的表示为带箭头的线段。箭头所指:代表向量的方向;线段长度:代表向量的大小。与向量对应的量叫做数量(物理学中称为标量),数量(标量)只有大小,没有方向。

  在物理学和工程学中,几何向量更常被称为矢量。许多物理量都是矢量,比如一个物体的唯一,球撞向墙对其施加的力等等。与之相对的是标量,即只有大小没有方向的量。一些与向量有关的定义亦与物理概念有密切的联系,例如向量势对应于物理中的势能。 

3.2  有关向量的线性表示

3.3  向量组的秩与矩阵的秩之间的关系

  设 r(Am*n) = r ,则 A 的秩 r(A) 与 A 的行列向量组的线性相关性关系为:

3.4  n 维向量空间的基变换公式及过渡矩阵

  若 α1, α2, ...α与 β1, β2,...  β是向量空间 V 的两组基,则基变换公式为:

  其中 C是可逆矩阵,称为由基 α1,α2,....αn到基β1,β2,...βn 的过渡矩阵。

  坐标变换公式

3.5  向量的内积(点积)

  点积在数学中,又称数量积(dot product;scalar product),是指接受在实数R上的两个向量并返回一个实数值标量的二元运算。它是欧几里得空间的标准内积。

  设有 n 维向量:

  则当:

  此时,我们就把 [x. y] 叫做向量的内积。

  内积的性质如下:

3.6  向量的长度

  几何空间中向量长度概念的推广,设 x 为欧式空间 V 的向量,非负实数(x,  x)的算法平方根 √ (x, x) 称为向量 x 的长度或长,也称为 x 的模,记为 ||x||。

  向量的长度具有如下性质:

  • 1,对于任意的 x 属于 V,|x| >=0, |x|=0 当且仅当 x=0
  • 2,对于任意的 k 属于 R,x属于V,|kx|=|k||x|,其中 |k| 是 k的绝对值。

  老师的PPT如下:

3.7  向量的正交

  两两正交的非零向量组成为正交向量组。若 a1, a2,....ar 是两两正交的非零向量,则 a1, a2,....ar  线性无关。

  例如,已知三维向量空间 R3 中两个向量a1, a正交,试求一个非零向量 a3,使得a1, a2 ,a3 两两正交:

3.8  正交基及规范正交基

  向量空间一组基中的向量如果两两正交,就称为正交基;若正交基中每个向量都是单位向量,就称其为规范正交基。

  其性质如下:

4,线性方程组

4.1  克莱姆法则

  对于线性方程组:

  如果系数行列式 D =  |A| ≠ 0,则方程有唯一解,

  其中 Dj 是把 D 中第 j 列元素换成方程组右端的常数类所得的行列式。

  n阶矩阵 A 可逆 r(Am*n) = m 只有零解  <==>  对于任意b,Ax = b 总有唯一解,一般地,r(Am*n)  <==> Ax=0 只有零解。

4.2  非齐次线性方程组有解的充分必要条件,线性方程组解的性质和解决的结构

4.3  齐次线性方程的基础解析和通解,解空间,非其次线性方程组的通解

参考链接:https://zhuanlan.zhihu.com/p/36584206

原文地址:https://www.cnblogs.com/shiyueyangne/p/14251754.html