CS 分解

将学习到什么

CS 分解是分划的酉矩阵在分划的酉等价之下的标准型. 它的证明涉及奇异值分解、QR 分解以及一个简单习题.


一个直观的习题

(Gamma, L in M_p). 假设 (Gamma = mathrm{diag}(gamma_1,cdots, gamma_p)), 其中 (0 leqslant gamma_1 leqslant cdots leqslant gamma_p leqslant 1), (L=[ell_{ij}]) 是下三角的, 则
egin{align}
egin{bmatrix} Gamma & L & 0end{bmatrix}=egin{bmatrix} gamma_1 & &&& ell_{11} & & & 0 & 0 & & & 0 \
& gamma_2 &&& ell_{21} & ell_{22} & & & & ddots & & \
& & ddots & & vdots & vdots & ddots & & & & ddots & \
& & & gamma_p & ell_{p1} & ell_{p2} & cdots & ell_{pp} & 0 & & & 0 end{bmatrix} in M_{p,2p+k}
end{align}
如果 ([Gamma quad L quad 0]) 的行是标准正交的,我们断定 (L) 是对角的, (L=mathrm{diag}(lambda_1,cdots , lambda_p)), 且 (lvert lambda_j vert ^2 = 1-gamma_j^2,\,\,j=1,cdots,p). 即
egin{align}
egin{bmatrix} Gamma & L & 0end{bmatrix}=egin{bmatrix} gamma_1 & &&& lambda_1 & & & & 0 & & & 0 \
& gamma_2 &&& & lambda_2 & & & & ddots & & \
& & ddots & & & & ddots & & & & ddots & \
& & & gamma_p & & & & lambda_p & 0 & & & 0 end{bmatrix}
end{align}

对行着手去做,证明很直观.
 

CS 分解定理

  定理(CS 分解):(p,q)(n) 是给定的整数,其中 (1<p leqslant q < n)(p+q =n). 设 (U= egin{bmatrix} U_{11} & U_{12} \ U_{21} & U_{22} end{bmatrix} in M_n) 是酉矩阵,其中 (U_{11} in M_p)(U_{22} in M_q). 则存在酉矩阵 (V_1,W_1 in M_p) 以及 (V_2, W_2 in M_q), 使得
egin{align}
egin{bmatrix} V_1 & 0 \ 0 & W_1 end{bmatrix} egin{bmatrix} U_{11} & U_{12} \ U_{21} & U_{22} end{bmatrix} egin{bmatrix} V_2 & 0 \ 0 & W_2 end{bmatrix} = egin{bmatrix} C & S & 0 \ -S & C & 0 \ 0 & 0& I_{q-p} end{bmatrix}
end{align}
其中 (C = mathrm{diag} (sigma_1,cdots, sigma_p)), (sigma_1 geqslant cdots geqslant sigma_p)(U_{11}) 的按照非增次序排列的奇异值,而 (S= mathrm{diag} left( (1-sigma_1^2)^{1/2},cdots, (1-sigma_1^p)^{1/2} ight))
 
  证明: 基本思路是做出一系列的酉等价,它们一步一步将 (U) 化简为具有所需要的形式的分块矩阵. 第一步是利用奇异值分解:记 (U_{11}=V Sigma W=(VK_p)(K_pSigma K_p)(K_pW)= ilde{V} Gamma ilde{W}), 其中 (V,W in M_p) 是酉矩阵,(K_p)(p imes p) 反序矩阵. ( ilde{V}=VK_p), ( ilde{W}=K_pW), (Sigma = mathrm{diag}(sigma_1, cdots, sigma_p)), 其中 (sigma_1 geqslant cdots geqslant sigma_p), 且 (Gamma = K_pSigma K_p = mathrm{diag}(sigma_p, cdots, sigma_1)). 计算
egin{align}
egin{bmatrix} ilde{V}^* & 0 \ 0 & I_q end{bmatrix} egin{bmatrix} U_{11} & U_{12} \ U_{21} & U_{22} end{bmatrix} egin{bmatrix} ilde{W}^* & 0 \ 0 & I_q end{bmatrix} = egin{bmatrix} Gamma & hat{V}^*U_{12} \ U_{21} ilde{W}^* & U_{22} end{bmatrix}
end{align}
这个矩阵是酉矩阵(它是三个酉矩阵的乘积),所以每一列的 Euclid 范数均为 1 ,这就意味着 (sigma_1 = gamma_p leqslant 1). 现在利用 QR 分解以及它的变形来记 ( ilde{V}^*U_{12}=[L quad 0] ilde{Q}) 以及 (U_{21} ilde{W}^* = Q egin{bmatrix} R \ 0 end{bmatrix}), 其中 ( ilde{Q},Q in M_q) 是酉矩阵, (L=[ell_{ij}] in M_p) 是下三角矩阵,而 (R=[r_{ij}] in M_p) 是上三角矩阵. 计算
egin{align}
egin{bmatrix} I_p & 0 \ 0 & Q^* end{bmatrix} egin{bmatrix} Gamma & hat{V}^*U_{12} \ U_{21} ilde{W}^* & U_{22} end{bmatrix} egin{bmatrix} I_p & 0 \ 0 & ilde{Q}^* end{bmatrix} = egin{bmatrix} Gamma &egin{bmatrix} L & 0 end{bmatrix} \ egin{bmatrix} R \ 0 end{bmatrix} & Q^*U_{22} ilde{Q}^* end{bmatrix}
end{align}
上一习题中和论证方法表明:(L)(R) 两者都是对角的,且对每个 (i=1,cdots,p)(lvert r_{ii} vert = lvert ell_{ii} vert = sqrt{1-gamma_i^2}). 设 (M=mathrm{diag}(sqrt{1-gamma_1^2},cdots, sqrt{1-gamma_p^2})), 并令 (t=max { i:gamma_i <1 }). 则存在对角酉矩阵 (D_1,D_2 in M_p) 使得 (D_1R=-M) 以及 (LD_2=M), 所以通过 (I_p oplus D_1 oplus I_{n-2p}) 在左边作成的酉相合与通过 (I_p oplus D_2 oplus I_{n-2p}) 在右边作成的酉相合产生出一个形如
egin{align}
egin{bmatrix} Gamma &egin{bmatrix} M & 0 end{bmatrix} \ egin{bmatrix} -M \ 0 end{bmatrix} & Z end{bmatrix} = egin{bmatrix} Gamma_1 & 0 & M_1 & 0 & 0 \ 0 & I_{p-t} & 0 & 0_{p-t} & 0 \ -M_1 & 0 & Z_{11} & Z_{12} & Z_{13} \ 0 & 0_{p-t} & Z_{21} & Z_{22} & Z_{23} \ 0 & 0& Z_{31} & Z_{32} & Z_{33} end{bmatrix}
end{align}
的酉矩阵,其中有分划的酉矩阵 (Gamma = Gamma_1 oplus I_{p-t}) 以及 (M=M_1 oplus 0_{p-t}), 所以 (M_1) 是非奇异的. 第一行和第三分块列的正交性(以及 (M_1) 的非奇异性)就蕴含 (Z_{11}=Gamma_1), 因此要求每一行和每一列都是单位向量就确保了 (Z_{12}), (Z_{13}), (Z_{21}) 以及 (Z_{31}) 全都是零分块. 从而我们有
egin{align}
egin{bmatrix} Gamma_1 & 0 & M_1 & 0 & 0 \ 0 & I_{p-t} & 0 & 0_{p-t} & 0 \ -M_1 & 0 & Z_{11} & 0& 0 \ 0 & 0_{p-t} & 0 & Z_{22} & Z_{23} \ 0 & 0& 0 & Z_{32} & Z_{33} end{bmatrix}
end{align}
其右下角分块 ( ilde{Z}= egin{bmatrix} Z_{22} & Z_{23} \ Z_{32} & Z_{33} end{bmatrix} in M_{q-t}) 是酉矩阵的一个直和项,故而它是酉矩阵,于是对某个酉矩阵 (hat{V},hat{W} in M_{q-1})( ilde{Z}=hat{V}I_{q-t}hat{W}). 通过 (I_{p+t} oplus hat{V}^*) 在左边作出的酉等价以及通过 (I_{p+t} oplus hat{W}^*) 在右边作出的酉等价产生出分块矩阵
egin{align}
egin{bmatrix} Gamma_1 & 0 & M_1 & 0 & 0 \ 0 & I_{p-t} & 0 & 0_{p-t} & 0 \ -M_1 & 0 & Z_{11} & 0& 0 \ 0 & 0_{p-t} & 0 & I_{p-t} & 0 \ 0 & 0& 0 & 0 & I_{q-p} end{bmatrix}
end{align}
最后通过 (K_p oplus K_p oplus I_{q-p}) 作出的酉相似产生出一个酉矩阵,它具有所要求的构造.

理解 CS 分解定理

CS 分解是与 (I_p oplus I_q) 共形地加以分划且阶为 (n=p+q) (为方便起见,设 (p leqslant q), 但这不是本质的要求)的所有酉矩阵 (U= egin{bmatrix} U_{11} & U_{12} \ U_{21} & U_{22} end{bmatrix} in M_n) 组成的集合的一种参数化的描述. 这些参数是四个更小的任意的酉矩阵 (V_1,W_1 in M_p) 以及 (V_2, W_2 in M_q),以及任意 (p) 个实数 (sigma_1,cdots, sigma_p), (1 geqslant sigma_1 geqslant cdots geqslant sigma_p geqslant 0). 这四个分块的参数化是
egin{align}
U_{11} &= V_1 C W_1 , quad &U_{12} &=V_1 egin{bmatrix} S & 0 end{bmatrix} W_2 \
U_{21} &= V_2 egin{bmatrix} -S \ 0 end{bmatrix} W_1 &U_{22} &= V_2 egin{bmatrix} C & 0 \ 0 & I_{q-p} end{bmatrix} W_2
end{align}
其中 (C=mathrm{diag}(sigma_1, cdots, sigma_p)), 而 (S= mathrm{diag} left( (1-sigma_1^2)^{1/2},cdots, (1-sigma_1^p)^{1/2} ight)). CS 分解是一种用途广泛的工具,特别是在与子空间之间的距离以及角度有关的问题中.


应该知道什么

  • CS 分解是分划的酉矩阵在分划的酉等价之下的标准型
原文地址:https://www.cnblogs.com/zhoukui/p/7821580.html