统计分析与R软件-chapter2-5

2.5 多维数组和矩阵

2.5.1 生成数组或矩阵

数组有一个特征属性叫做维数向量(dim属性)，维数向量是一个元素取正整数的向量，其长度是数组的维数，比如维数向量有两个元素时数组为2维数组（矩阵）。维数向量的每一个元素指定了该下标的上界，下标的下界总为1

1.将向量定义成数组

向量只有定义了维数向量（dim属性）后才能被看作是数组

> z<-1:12
> dim(z)<-c(3,4);z
     [,1] [,2] [,3] [,4]
[1,]    1    4    7   10
[2,]    2    5    8   11
[3,]    3    6    9   12
> dim(z)<-12;z
 [1]  1  2  3  4  5  6  7  8  9 10 11 12

2.用array()函数构造多维数组

R软件可以用array()函数直接构造数组，其构造形式为

array(data=NA,dim=length(data),dimnames=NULL)

其中data是一个向量数据，dim是数组各维的长度，缺省时是原向量的长度，dimnames是数组维的名字，缺省时为空

> X<- array(1:20,dim=c(4,5));X
     [,1] [,2] [,3] [,4] [,5]
[1,]    1    5    9   13   17
[2,]    2    6   10   14   18
[3,]    3    7   11   15   19
[4,]    4    8   12   16   20
> Z<- array(0,dim=c(3,4,2));Z
, , 1

     [,1] [,2] [,3] [,4]
[1,]    0    0    0    0
[2,]    0    0    0    0
[3,]    0    0    0    0

, , 2

     [,1] [,2] [,3] [,4]
[1,]    0    0    0    0
[2,]    0    0    0    0
[3,]    0    0    0    0

3.用matrix()函数构造矩阵

函数matrix()是构造矩阵的函数，其构造形式为

matrix(data=NA,nrow=1,ncol=1,byrow=FALSE,dimnames=NULL)

其中data是一个向量数据，nrow是矩阵的行数，ncol是矩阵的列数。当byrow=TRUE时，生成矩阵的数据按行放置，缺省时相当于byrow=FALSE，数据按列放置。dimnames是数组维数的名字，缺省时为空

> A<- matrix(1:15,nrow=3,ncol=5,byrow = TRUE);A
     [,1] [,2] [,3] [,4] [,5]
[1,]    1    2    3    4    5
[2,]    6    7    8    9   10
[3,]   11   12   13   14   15
> A<- matrix(1:15,nrow=3,byrow=TRUE);A
     [,1] [,2] [,3] [,4] [,5]
[1,]    1    2    3    4    5
[2,]    6    7    8    9   10
[3,]   11   12   13   14   15

2.5.2 数组下标

1.数组下标

> a<-1:24
> dim(a)<-c(2,3,4)
> a[2,1,2]
[1] 8
> a[1,2:3,2:3]
     [,1] [,2]
[1,]    9   15
[2,]   11   17
> a
, , 1

     [,1] [,2] [,3]
[1,]    1    3    5
[2,]    2    4    6

, , 2

     [,1] [,2] [,3]
[1,]    7    9   11
[2,]    8   10   12

, , 3

     [,1] [,2] [,3]
[1,]   13   15   17
[2,]   14   16   18

, , 4

     [,1] [,2] [,3]
[1,]   19   21   23
[2,]   20   22   24

> a[1,,]
     [,1] [,2] [,3] [,4]
[1,]    1    7   13   19
[2,]    3    9   15   21
[3,]    5   11   17   23
> a[,2,]
     [,1] [,2] [,3] [,4]
[1,]    3    9   15   21
[2,]    4   10   16   22
> a[1,1,]
[1]  1  7 13 19
> a[3:10]
[1]  3  4  5  6  7  8  9 10

2.不规则的数组下标

在R语言中，甚至可以把数组中的任意位置的元素作为数组访问，其方法是用一个二维数组作为数组的下标，二维数组的每一个行是一个元素的下标，列数为数组的维数。

例如，要把上面的形状为234的数组a的第[1,1,1],[2,2,3],[1,3,4],[2,1,4]号共四个元素作为一个整体访问，先定义一个包含这些下标作为行的二维数组：

> b<- matrix(c(1,1,1,2,2,3,1,3,4,2,1,4),ncol=3,byrow = TRUE);b
     [,1] [,2] [,3]
[1,]    1    1    1
[2,]    2    2    3
[3,]    1    3    4
[4,]    2    1    4
> a[b]
[1]  1 16 23 20
> a[b]<-c(101,102,103,104);a[b]
[1] 101 102 103 104
> a
, , 1

     [,1] [,2] [,3]
[1,]  101    3    5
[2,]    2    4    6

, , 2

     [,1] [,2] [,3]
[1,]    7    9   11
[2,]    8   10   12

, , 3

     [,1] [,2] [,3]
[1,]   13   15   17
[2,]   14  102   18

, , 4

     [,1] [,2] [,3]
[1,]   19   21  103
[2,]  104   22   24

2.5.3 数组的四则运算

> A<- matrix(1:6,nrow = 2,byrow = TRUE);A
     [,1] [,2] [,3]
[1,]    1    2    3
[2,]    4    5    6
> B<- matrix(1:6,nrow = 2);B
     [,1] [,2] [,3]
[1,]    1    3    5
[2,]    2    4    6
> C<- matrix(c(1,2,2,3,3,4),nrow = 2);C
     [,1] [,2] [,3]
[1,]    1    2    3
[2,]    2    3    4
> D<- 2*C+A/B;D
     [,1]     [,2] [,3]
[1,]    3 4.666667  6.6
[2,]    6 7.250000  9.0

形状不一致的向量（或数组）也可以进行四则运算，一般的规则是将向量（或数组）中的数据与对应向量（或数组）中的数据进行运算，把短向量（或数组）的数据循环使用，从而可以与长向量（或数组）数据进行匹配，并尽可能保留共同的数组属性

> x1<-c(100,200)
> x2<-1:6
> x1+x2
[1] 101 202 103 204 105 206
> x3<- matrix(1:6,nrow = 3)
> x1+x3
     [,1] [,2]
[1,]  101  204
[2,]  202  105
[3,]  103  206
> x2<- 1:5
> x1+x2
[1] 101 202 103 204 105
Warning message:
In x1 + x2 : 长的对象长度不是短的对象长度的整倍数

2.5.4 矩阵的运算

1.转置运算

> A<-matrix(1:6,nrow=2);A
     [,1] [,2] [,3]
[1,]    1    3    5
[2,]    2    4    6
> t(A)
     [,1] [,2]
[1,]    1    2
[2,]    3    4
[3,]    5    6
> ### 2.求方阵的行列式
> det(matrix(1:4,ncol=2))
[1] -2
> ### 3.向量的内积
> x<-1:5;y<-2*1:5
> x%*%y
     [,1]
[1,]  110

函数crossprod()是内积运算函数（表示交叉乘积），crossprod(x,y)计算向量x与y的内积，即't(x) %*% y'

> crossprod(x,y)
     [,1]
[1,]  110
> x;t(x)
[1] 1 2 3 4 5
     [,1] [,2] [,3] [,4] [,5]
[1,]    1    2    3    4    5

crossprod(x)表示x与x的内积，即(||x||^2_2)

类似地，tcrossprod(x,y)表示'x%*% t(y)',即x与y的外积，也称为叉积。tcrossprod(x)表示x与x作外积

> tcrossprod(x,y)
     [,1] [,2] [,3] [,4] [,5]
[1,]    2    4    6    8   10
[2,]    4    8   12   16   20
[3,]    6   12   18   24   30
[4,]    8   16   24   32   40
[5,]   10   20   30   40   50
> tcrossprod(x)
     [,1] [,2] [,3] [,4] [,5]
[1,]    1    2    3    4    5
[2,]    2    4    6    8   10
[3,]    3    6    9   12   15
[4,]    4    8   12   16   20
[5,]    5   10   15   20   25

4.向量的外积（叉积）

设x,y是n维向量，则x %o% y表示x与y作外积

> x<-1:5;y<-2*1:5
> x %o% y
     [,1] [,2] [,3] [,4] [,5]
[1,]    2    4    6    8   10
[2,]    4    8   12   16   20
[3,]    6   12   18   24   30
[4,]    8   16   24   32   40
[5,]   10   20   30   40   50

outer()是外积运算函数，outer(x,y)计算向量x与y的外积，它等价于 x %o% y

函数outer()的一般调用格式为

outer(X,Y,fun='*',...)

其中X,Y矩阵(或向量)，fun是作外积运算函数，缺省值为乘法运算，函数outer()在绘制三维曲面时非常有用，它可以生成一个X和Y的网格，

> outer(x,y)
     [,1] [,2] [,3] [,4] [,5]
[1,]    2    4    6    8   10
[2,]    4    8   12   16   20
[3,]    6   12   18   24   30
[4,]    8   16   24   32   40
[5,]   10   20   30   40   50

5.矩阵的乘法

如果矩阵A和B具有相同的维数，则AB表示矩阵中对应的元素的乘积，A %% B表示通常意义下的两个矩阵的乘积（要求矩阵A的列数等于矩阵B的行数）

> A<-array(1:9,dim=(c(3,3)))
> B<-array(9:1,dim=(c(3,3)))
> C<-A*B;C
     [,1] [,2] [,3]
[1,]    9   24   21
[2,]   16   25   16
[3,]   21   24    9
> D<- A%*%B;D
     [,1] [,2] [,3]
[1,]   90   54   18
[2,]  114   69   24
[3,]  138   84   30

crossprod(A,B)表示的是t(A)%%B,函数tcrossprod(A,B)表示的是A%%t(B)

> A
     [,1] [,2] [,3]
[1,]    1    4    7
[2,]    2    5    8
[3,]    3    6    9
> B<-c(1:3);B
[1] 1 2 3
> crossprod(B,A)
     [,1] [,2] [,3]
[1,]   14   32   50
> t(B);crossprod(t(B),A)
     [,1] [,2] [,3]
[1,]    1    2    3
Error in crossprod(t(B), A) : 非整合参数
> tcrossprod(A,B)
Error in tcrossprod(A, B) : 非整合参数
> tcrossprod(A,t(B))
     [,1]
[1,]   30
[2,]   36
[3,]   42

6.生成对角阵和矩阵取对角运算

函数diag()依赖于它的变量，当v是一个向量时，diag(v)表示以v的元素为对角线元素的对角阵。当M是一个矩阵时，则diag(M)表示的是取M对角线上的元素的向量

> v<-c(1,4,5)
> diag(v)
     [,1] [,2] [,3]
[1,]    1    0    0
[2,]    0    4    0
[3,]    0    0    5
> M<-array(1:9,dim=c(3,3));M
     [,1] [,2] [,3]
[1,]    1    4    7
[2,]    2    5    8
[3,]    3    6    9
> diag(M)
[1] 1 5 9

7.解线性方程组和求矩阵的逆矩阵

若求解线性方程组Ax=b，其命令形式为solve(A,b),求矩阵A的逆，其命令形式为solve(A)

> A<-t(array(c(1:8,10),dim=c(3,3)))
> b<-c(1,1,1)
> x<-solve(A,b);x
[1] -1.000000e+00  1.000000e+00  3.330669e-16
> B<-solve(A);B
           [,1]      [,2] [,3]
[1,] -0.6666667 -1.333333    1
[2,] -0.6666667  3.666667   -2
[3,]  1.0000000 -2.000000    1
> A %*% B
     [,1]         [,2]          [,3]
[1,]    1 8.881784e-16 -4.440892e-16
[2,]    0 1.000000e+00 -1.776357e-15
[3,]    0 0.000000e+00  1.000000e+00

8.求矩阵的特征值与特征值向量

eigen(Sm)是求对称矩阵Sm的特征值与特征向量，其命令形式为

ev<-eigen(Sm)

ev存放着对称矩阵Sm特征值和特征向量，是由列表形式给出，其中ev(values是Sm的特征值构成的向量，ev)vectors是Sm的特征向量构成的矩阵

> A
     [,1] [,2] [,3]
[1,]    1    2    3
[2,]    4    5    6
[3,]    7    8   10
> Sm<-crossprod(A,A);Sm
     [,1] [,2] [,3]
[1,]   66   78   97
[2,]   78   93  116
[3,]   97  116  145
> ev<-eigen(Sm);ev
eigen() decomposition
$values
[1] 303.19533618   0.76590739   0.03875643

$vectors
           [,1]         [,2]       [,3]
[1,] -0.4646675  0.833286355  0.2995295
[2,] -0.5537546 -0.009499485 -0.8326258
[3,] -0.6909703 -0.552759994  0.4658502

9.矩阵的奇异值分解

函数svd(A)是对称A作奇异值分解，即A=UDV',其中U,V是正交阵，D为对角阵，也就是矩阵A的奇异值。svd(A)的返回值也是列表，svd(A)(d表示矩阵A的奇异值，即矩阵D的对角线上的元素，svd(A))u对应的是正交阵U，svd(A)$v对应的是正交阵V

> svdA<-svd(A);svdA
$d
[1] 17.4125052  0.8751614  0.1968665

$u
           [,1]        [,2]       [,3]
[1,] -0.2093373  0.96438514  0.1616762
[2,] -0.5038485  0.03532145 -0.8630696
[3,] -0.8380421 -0.26213299  0.4785099

$v
           [,1]         [,2]       [,3]
[1,] -0.4646675 -0.833286355  0.2995295
[2,] -0.5537546  0.009499485 -0.8326258
[3,] -0.6909703  0.552759994  0.4658502

> attach(svdA)
The following object is masked _by_ .GlobalEnv:

    v

> u %*% diag(d) %*% t(v)
Error in u %*% diag(d) %*% t(v) : 非整合参数

10.求矩阵行列式的值

> det(A)
[1] -3

11.最小拟合与QR分解

> x<-c(0.0,0.2,0.4,0.6,0.8)
> y<-c(0.9,1.9,2.8,3.3,4.2)
> lsfit.sol<-lsfit(x,y);lsfit.sol
$coefficients
Intercept         X 
     1.02      4.00 

$residuals
[1] -0.12  0.08  0.18 -0.12 -0.02

$intercept
[1] TRUE

$qr
$qt
[1] -5.85849810  2.52982213  0.23749843 -0.02946714  0.10356728

$qr
      Intercept          X
[1,] -2.2360680 -0.8944272
[2,]  0.4472136  0.6324555
[3,]  0.4472136 -0.1954395
[4,]  0.4472136 -0.5116673
[5,]  0.4472136 -0.8278950

$qraux
[1] 1.447214 1.120788

$rank
[1] 2

$pivot
[1] 1 2

$tol
[1] 1e-07

attr(,"class")
[1] "qr"

(coefficients是拟合系数，)residuals是拟合残差

与lsfit()函数有密切关系的函数是ls.diag(),它给出拟合的进一步统计信息

另一个最小二乘拟合有密切关系的函数是QR分解函数qr(),qe.coef(),qr.fitted()和qr.resid()

> X<-matrix(c(rep(1,5),x),ncol = 2);X
     [,1] [,2]
[1,]    1  0.0
[2,]    1  0.2
[3,]    1  0.4
[4,]    1  0.6
[5,]    1  0.8
> Xplus<-qr(X);Xplus
$qr
           [,1]       [,2]
[1,] -2.2360680 -0.8944272
[2,]  0.4472136  0.6324555
[3,]  0.4472136 -0.1954395
[4,]  0.4472136 -0.5116673
[5,]  0.4472136 -0.8278950

$rank
[1] 2

$qraux
[1] 1.447214 1.120788

$pivot
[1] 1 2

attr(,"class")
[1] "qr"

QR分解函数qr()输入的设计矩阵需要加以1为元素的列，其返回值是列表，其中(qr矩阵的上三角阵是QR分解中得到的R矩阵，下三角阵是QR分解得到的正交阵Q的部分信息，)qraux是Q的附加信息

可用QR分解得到的结果计算最小二乘的系数

> b<- qr.coef(Xplus,y);b
[1] 1.02 4.00

得到的系数与函数lsfit()得到的结果相同，但是为什么用这种方法计算呢？这是因为用QR分解在计算最小二乘拟合时，其计算误差比一般方法要小

类似的，可以用QR分解得到最小二乘的拟合值和残差值

> fit<-qr.fitted(Xplus,y);fit
[1] 1.02 1.82 2.62 3.42 4.22
> res<-qr.resid(Xplus,y);res
[1] -0.12  0.08  0.18 -0.12 -0.02

2.5.5 与矩阵（数组）运算相关的函数

1.取矩阵的维数

> A<-matrix(1:6,nrow=2);A
     [,1] [,2] [,3]
[1,]    1    3    5
[2,]    2    4    6
> dim(A)
[1] 2 3
> nrow(A)
[1] 2
> ncol(A)
[1] 3

2.矩阵的合并

函数cbind()把其自变量横向拼成一个大矩阵，rbind()把其自变量纵向拼成一个大矩阵

> x1<-rbind(c(1,2),c(3,4));x1
     [,1] [,2]
[1,]    1    2
[2,]    3    4
> x2<-10+x1
> x3<-cbind(x1,x2);x3
     [,1] [,2] [,3] [,4]
[1,]    1    2   11   12
[2,]    3    4   13   14
> x4<-rbind(x1,x2);x4
     [,1] [,2]
[1,]    1    2
[2,]    3    4
[3,]   11   12
[4,]   13   14
> cbind(1,x1)
     [,1] [,2] [,3]
[1,]    1    1    2
[2,]    1    3    4

3.矩阵的拉直

> A<-matrix(1:6,nrow=2);A
     [,1] [,2] [,3]
[1,]    1    3    5
[2,]    2    4    6
> as.vector(A)
[1] 1 2 3 4 5 6

4.数组的维名字

> X<-matrix(1:6,ncol=2,dimnames = list(c("one","two","three"),c("First","Second")),byrow=T);X
      First Second
one       1      2
two       3      4
three     5      6
> X<-matrix(1:6,ncol=2,byrow=T)
> dimnames(X)<-list(c("one","two","three"),c("First","Second"))
> colnames(X)
[1] "First"  "Second"
> rownames(X)
[1] "one"   "two"   "three"

5.矩阵的广义转置

可以用aperm(A,perm)函数把数组A的各维按perm中指定的新次序重新排列

> A<-array(1:24,dim=c(2,3,4));A
, , 1

     [,1] [,2] [,3]
[1,]    1    3    5
[2,]    2    4    6

, , 2

     [,1] [,2] [,3]
[1,]    7    9   11
[2,]    8   10   12

, , 3

     [,1] [,2] [,3]
[1,]   13   15   17
[2,]   14   16   18

, , 4

     [,1] [,2] [,3]
[1,]   19   21   23
[2,]   20   22   24

> B<-aperm(A,c(2,3,1));B
, , 1

     [,1] [,2] [,3] [,4]
[1,]    1    7   13   19
[2,]    3    9   15   21
[3,]    5   11   17   23

, , 2

     [,1] [,2] [,3] [,4]
[1,]    2    8   14   20
[2,]    4   10   16   22
[3,]    6   12   18   24

结果是B把A的第2维移到了第1维，A的第3维移到了第2维，A的第1维移到了第3维，这时有B[i,j,k]=A[i,k,i]

> B[1,3,2];A[3,2,1]
[1] 14
Error in A[3, 2, 1] : 下标出界

6.apply函数

对于向量，可以用sum,mean等函数对其进行计算，对于数组（矩阵），如果想对其1维（或若干维）进行某种计算，可用apply函数，其一般形式为

apply(A,MARGIN,FUN,...)

其中A为一个数组，MARGIN是固定哪些维不变，FUN是用来计算的函数

> A<-matrix(1:6,nrow=2);A
     [,1] [,2] [,3]
[1,]    1    3    5
[2,]    2    4    6
> apply(A, 1, sum)
[1]  9 12
> apply(A, 2, mean)
[1] 1.5 3.5 5.5