复旦大学数学学院18级高等代数II期中考试第七大题的三种证法及其推广

第七大题  设 $A$ 为 $n$ 阶复方阵, 证明: 存在复数 $c_1,cdots,c_{n-1}$, 使得 $$A-c_1e^A-c_2e^{2A}-cdots-c_{n-1}e^{(n-1)A}$$ 是可对角化矩阵.

本题是复旦大学数学学院 18 级高等代数 II 期中考试的第七大题, 虽然结论涉及矩阵的多项式表示和可对角化矩阵, 但考察的重点其实是矩阵 Jordan 标准型的应用. 本题有三种证法, 第一种证法就是 Jordan 标准型的应用, 整个证明过程类似于 Jordan-Chevalley 分解定理的证明. 注意在“三段论法”的第一步, 我们并非只证明单个 Jordan 块的情形, 而需要将相差 $2kpimathrm{i}\,(kinmathbb{Z})$ 的特征值的所有 Jordan 块放在一起考虑. 第二种证法 (由但晖博士后提供) 直接利用 Jordan-Chevalley 分解定理来证明, 先处理幂零矩阵的情形, 再处理一般的情形. 第三种证法 (由 18 级周烁星同学提供) 另辟蹊径, 只利用 Jordan 块的基本性质和 Hermite-Lagrange 多重插值公式就给出了一个简洁的证明.

定义  两个复数 $lambda,mu$ 称为等价的, 如果 $e^lambda=e^mu$, 即 $lambda-mu=2kpimathrm{i}\,(kinmathbb{Z})$.

证法一 (Jordan 标准型的应用)  设 $P$ 为非异阵, 使得 $P^{-1}AP=J=mathrm{diag}{J_1,J_2,cdots,J_k}$ 为 Jordan 标准型, 其中 $[lambda_1],[lambda_2],cdots,[lambda_k]$ 是 $A$ 的特征值的等价类全体, 与 $lambda_i$ 等价的所有特征值的 Jordan 块拼成的分块对角阵为 $J_i$, 其阶数设为 $n_i\,(1leq ileq k)$. 以下按照“三段论法”来进行讨论 (参考高代白皮书的第 7.2.8 节). 

Step 1  任取 $J_i$ 中某一 Jordan 块 $J_{r_i}(lambda_i)$, 由高代教材第 333 页的第二行公式可得: $$e^{jJ_{r_i}(lambda_i)}=e^{jlambda_i}cdotegin{pmatrix} 1 & dfrac{j}{1!} & dfrac{j^2}{2!} & cdots & dfrac{j^{r_i-1}}{(r_i-1)!} \ & 1 & dfrac{j}{1!} & ddots & vdots \ & & ddots & ddots & dfrac{j^2}{2!} \ & & & ddots & dfrac{j}{1!} \ & & & & 1\ end{pmatrix}.$$ 若设 $$(1)quad J_{r_i}(lambda_i)=c_0I_{r_i}+c_1e^{J_{r_i}(lambda_i)}+c_2e^{2J_{r_i}(lambda_i)}+cdots+c_{n-1}e^{(n-1)J_{r_i}(lambda_i)},$$ 则 (1) 式等价于如下线性方程组, 其中 $d=e^{lambda_i} eq 0$: $$(2)quadleft{egin{array}{rcl} c_0+c_1d+c_2d^2+cdots+c_{n-1}d^{n-1}&=&lambda_i, \ c_1dfrac{d}{1!}+c_2dfrac{2d^2}{1!}+cdots+c_{n-1}dfrac{(n-1)d^{n-1}}{1!}&=&1, \ c_1dfrac{d}{2!}+c_2dfrac{2^2d^2}{2!}+cdots+c_{n-1}dfrac{(n-1)^2d^{n-1}}{2!}&=&0, \ cdotscdots&=&0, \ c_1dfrac{d}{(r_i-1)!}+c_2dfrac{2^{r_i-1}d^2}{(r_i-1)!}+cdots+c_{n-1}dfrac{(n-1)^{r_i-1}d^{n-1}}{(r_i-1)!}&=&0, \ end{array} ight.$$ 其矩阵形式为 $$(3)quadegin{pmatrix} 1 & d & d^2 & cdots & d^{n-1} \ 0 & dfrac{d}{1!} & dfrac{2d^2}{1!} & cdots & dfrac{(n-1)d^{n-1}}{1!} \ 0 & dfrac{d}{2!} & dfrac{2^2d^2}{2!} & cdots & dfrac{(n-1)^2d^{n-1}}{2!} \ vdots & vdots & vdots & & vdots \ 0 & dfrac{d}{(r_i-1)!} & dfrac{2^{r_i-1}d^2}{(r_i-1)!} & cdots & dfrac{(n-1)^{r_i-1}d^{n-1}}{(r_i-1)!} \ end{pmatrix}cdotegin{pmatrix} c_0 \ c_1 \ c_2 \ vdots \ c_{n-1} end{pmatrix}=egin{pmatrix} lambda_i \ 1 \ 0 \ vdots \ 0 end{pmatrix}.$$ 设方程组 (3) 的系数矩阵为 $M_{r_i imes n}$, 通过 Vandermonde 行列式易证 $r(M)=r_i$, 即 $M$ 是行满秩阵, 从而由 $M$ 诱导的线性映射是满射, 于是方程组 (3) 必有解, 这等价于存在复数 $c_0,c_1,c_2,cdots,c_{n-1}$, 使得 (1) 式成立, 即每个 Jordan 块 $J_{r_i}(lambda_i)$ 都可表示为 $e^{J_{r_i}(lambda_i)}$ 的多项式.

一般地, 取 $J_i$ 中阶数最大的 Jordan 块 $J_{r_i}(lambda_i)$ 以及满足 (1) 式的复数 $c_0,c_1,c_2,cdots,c_{n-1}$. 注意到方程组 (3) 中的矩阵 $M_{r_i imes n}$ 只依赖于 $d=e^{lambda_i}$, 故对 $J_i$ 中另一 Jordan 块 $J_{r_j}(lambda_j)$, 其中 $lambda_i$ 与 $lambda_j$ 等价且 $r_igeq r_j$, 则 $M_{r_j imes n}$ 是 $M_{r_i imes n}$ 的子矩阵. 换言之, Jordan 块 $J_{r_j}(lambda_j)$ 对应的方程组 (2), 除了第一个方程右端是 $lambda_j$ 之外, 其余方程都是 Jordan 块 $J_{r_i}(lambda_i)$ 对应的方程组 (2) 的一部分. 由此可得 $$(4)quad J_{r_j}(lambda_j)=(c_0+lambda_j-lambda_i)I_{r_j}+c_1e^{J_{r_j}(lambda_j)}+c_2e^{2J_{r_j}(lambda_j)}+cdots+c_{n-1}e^{(n-1)J_{r_j}(lambda_j)}.$$ 令 $$g_i(lambda)=c_0+c_1lambda+c_2lambda^2+cdots+c_{n-1}lambda^{n-1}inmathbb{C}[lambda],$$ 则由 (1) 式和 (4) 式可知 $J_i-g_i(e^{J_i})=Lambda_i$ 为对角阵, 且主对角线上的元素为 $2kpimathrm{i}\,(kinmathbb{Z})$.

Step 2  注意到 $e^{J_i}$ 的特征多项式为 $(lambda-e^{lambda_i})^{n_i}\,(1leq ileq k)$, 它们两两互素, 故由中国剩余定理可知, 存在 $g(lambda)inmathbb{C}[lambda]$, 使得 $$g(lambda)=(lambda-e^{lambda_i})^{n_i}q_i(lambda)+g_i(lambda),quad 1leq ileq k.$$ 设 $e^J=mathrm{diag}{e^{J_1},e^{J_2},cdots,e^{J_k}}$ 的特征多项式为 $f(lambda)=prodlimits_{i=1}^k(lambda-e^{lambda_i})^{n_i}$, 则由带余除法可得 $$g(lambda)=f(lambda)q(lambda)+h(lambda),quad deg h(lambda)<deg f(lambda)=n.$$ 由 Cayley-Hamilton 定理可知 $h(e^{J_i})=g(e^{J_i})=g_i(e^{J_i})$, 于是 $J_i-h(e^{J_i})=Lambda_i$. 令 $Lambda=mathrm{diag}{Lambda_1,Lambda_2,cdots,Lambda_k}$, 则 $Lambda$ 为对角阵, 主对角线上的元素为 $2kpimathrm{i}\,(kinmathbb{Z})$, 并且 $$J-h(J)=mathrm{diag}{J_1-h(e^{J_1}),J_2-h(e^{J_2}),cdots,J_k-h(e^{J_k})}=Lambda.$$

Step 3  最后, 我们有 $A-h(A)=P(J-h(J))P^{-1}=PLambda P^{-1}$, 这是一个可对角化矩阵, 其特征值为 $2kpimathrm{i}\,(kinmathbb{Z})$.

证法二 (Jordan-Chevalley 分解定理)  我们分两步来证明, 先处理幂零阵的情形, 再利用 Jordan-Chevalley 分解定理处理一般的情形.

Step 1  先假设 $A$ 为幂零阵, 即 $A^n=0$, 从而有 $$left{egin{array}{ccl} I_n&=&I_n, \ e^A&=&I_n+A+dfrac{A^2}{2!}+cdots+dfrac{A^{n-1}}{(n-1)!}, \ e^{2A}&=&I_n+2A+dfrac{2^2A^2}{2!}+cdots+dfrac{2^{n-1}A^{n-1}}{(n-1)!}, \ vdots&=&vdots \ e^{(n-1)A}&=&I_n+(n-1)A+dfrac{(n-1)^2A^2}{2!}+cdots+dfrac{(n-1)^{n-1}A^{n-1}}{(n-1)!}, \ end{array} ight.$$ 即有形式列向量的矩阵乘法: $$(5)quad egin{pmatrix} I_n \ e^A \ e^{2A} \ vdots \ e^{(n-1)A} \ end{pmatrix}=egin{pmatrix} 1 & 0 & 0 & cdots & 0 \ 1 & 1 & dfrac{1}{2!} & cdots & dfrac{1}{(n-1)!} \ 1 & 2 & dfrac{2^2}{2!} & cdots & dfrac{2^{n-1}}{(n-1)!} \ vdots & vdots & vdots & & vdots \ 1 & n-1 & dfrac{(n-1)^2}{2!} & cdots & dfrac{(n-1)^{n-1}}{(n-1)!} \ end{pmatrix}cdotegin{pmatrix} I_n \ A \ A^2 \ vdots \ A^{n-1} \ end{pmatrix}.$$ 注意到 (5) 式右边的 $n$ 阶方阵 $T$ 是一个非异阵 (因其行列式可化为 Vandermonde 行列式), 故可将 $T$ 从 (5) 式的右边移至左边变为 $T^{-1}$. 特别地, 对应形式列向量的矩阵乘法告诉我们: $A$ 可表示为 $e^A$ 的多项式, 从而结论得证.

Step 2  对于一般的情形, 考虑 $A$ 的 Jordan-Chevalley 分解 $A=B+C$, 其中 $B$ 为可对角化矩阵, $C$ 为幂零矩阵, $BC=CB$, 且 $B,C$ 均可表示为 $A$ 的多项式. 根据题目的结论, 我们只要证明 $C$ 可表示为 $e^A$ 的多项式即可 (注意: Step 1 只是证明了: $C$ 可表示为 $e^C$ 的多项式, 并非 $e^A$ 的多项式). 由于题目的条件和结论在同时相似关系下不改变, 并由 Jordan-Chevalley 定理的证明过程 (参考高代教材的第 324 页), 故不妨设 $A$ 为 Jordan 标准型, $B=mathrm{diag}{lambda_1,lambda_2,cdots,lambda_n}$ 为对角阵, $C=mathrm{diag}{C_1,C_2,cdots,C_k}$ 为分块对角阵, 其中 $lambda_1,lambda_2,cdots,lambda_n$ 是 $A$ 的全体特征值, $C_i$ 是 $n_i$ 阶幂零阵, $$mu_1=e^{lambda_1}=cdots=e^{lambda_{n_1}}, mu_2=e^{lambda_{n_1+1}}=cdots=e^{lambda_{n_1+n_2}}, cdots, mu_k=e^{lambda_{n_1+cdots+n_{k-1}+1}}=cdots=e^{lambda_n},$$ 并且 $mu_1,mu_2,cdots,mu_k$ 互不相同. 由 $BC=CB$ 可知 $$e^A=e^{B+C}=e^Bcdot e^C=egin{pmatrix} mu_1e^{C_1} & & & \ & mu_2e^{C_2} & & \ & & ddots & \ & & & mu_ke^{C_k} \ end{pmatrix}.$$ 由 Step 1 可知, $C$ 的每个分块 $C_i$ 都是 $e^{C_i}$ 的多项式, 从而是 $mu_ie^{C_i}$ 的多项式. 注意到 $e^A$ 的每个分块 $mu_ie^{C_i}$ 的特征值 $mu_i$ 互不相同, 故由高代白皮书的例 7.24 (中国剩余定理的应用) 可知, $C$ 是 $e^A$ 的多项式, 从而结论得证.

证法三 (多重插值公式)  令 $f(z)=z-c_1e^z-c_2e^{2z}-cdots-c_{n-1}e^{(n-1)z}$, 则 $$f'(z)=1-c_1e^z-2c_2e^{2z}-cdots-(n-1)c_{n-1}e^{(n-1)z}.$$ 令 $g(x)=1-c_1x-2c_2x^2-cdots-(n-1)c_{n-1}x^{n-1}inmathbb{C}[x]$, 则 $f'(z)=g(e^z)$. 本题的结论为: 确定函数 $f(z)$ (即确定常数 $c_1,c_2,cdots,c_{n-1}$), 使得 $f(A)$ 为可对角化矩阵. 注意到确定函数 $f(z)$ 等价于确定多项式 $g(x)$.

由于题目的条件和结论在相似关系下不改变, 故不妨设 $A=mathrm{diag}{J_{r_1}(lambda_1),J_{r_2}(lambda_2),cdots,J_{r_k}(lambda_k)}$ 为 Jordan 标准型, 于是 $f(A)=mathrm{diag}{f(J_{r_1}(lambda_1)),f(J_{r_2}(lambda_2)),cdots,f(J_{r_k}(lambda_k))}$, 其中 $$f(J_{r_i}(lambda_i))=egin{pmatrix} f(lambda_i) & f'(lambda_i) & dfrac{f^{(2)}(lambda_i)}{2!} & cdots & dfrac{f^{(r_i-1)}(lambda_i)}{(r_i-1)!} \ & f(lambda_i) & f'(lambda_i) & cdots & dfrac{f^{(r_i-2)}(lambda_i)}{(r_i-2)!} \ & & f(lambda_i) & cdots & dfrac{f^{(r_i-3)}(lambda_i)}{(r_i-3)!} \ & & & ddots & vdots \ & & & & f(lambda_i)\ end{pmatrix}.$$ 由 Hermite-Lagrange 多重插值公式 (参考 [3] 的第 12 章或 [4] 的第 1 章), 可取到次数小于等于 $n-1$ 的多项式 $g(x)inmathbb{C}[x]$, 使得 $$g(0)=1,quad g^{(j)}(e^{lambda_i})=0,quad 0leq jleq r_i-2,\,\,1leq ileq k,$$ 由此便确定了函数 $f(z)$. 进一步, 由 $f'(z)=g(e^z)$ 以及求导法则可知 $$f^{(j)}(lambda_i)=0,quad 1leq jleq r_i-1,\,\,\,\,1leq ileq k.$$ 由此即得 $f(J_{r_i}(lambda_i))=mathrm{diag}{f(lambda_i),f(lambda_i),cdots,f(lambda_i)}$ 为对角阵, 从而 $f(A)$ 也为对角阵.  $Box$

我们可得如下两个推论, 其中推论 1 是本题的推广, 推论 2 给出了 $A$ 表示为 $e^A$ 的多项式的充要条件.

推论 1  设 $A$ 为 $n$ 阶复方阵, 则存在次数小于等于 $n-1$ 的复系数多项式 $h(x)$, 使得 $A-h(e^A)$ 是一个可对角化矩阵, 其特征值为 $2kpimathrm{i}\,(kinmathbb{Z})$.

证明  由证法一的 Step 3 即得.  $Box$

推论 2  设 $A$ 为 $n$ 阶复方阵, 则 $A$ 可表示为 $e^A$ 的多项式的充要条件为, 如果 $A$ 有两个特征值等价, 则它们必相等. 特别地, 若 $A$ 的全体特征值的虚部都在 $[0,2pi)$ 中, 则 $A$ 可表示为 $e^A$ 的多项式.

证明  充分性由推论 1 即得. 至于必要性, 设 $A=h(e^A)$, 其中 $h(x)$ 为复系数多项式, $lambda,mu$ 是 $A$ 的两个等价特征值, 则它们也适合方程式 $x=h(e^x)$, 从而 $lambda=h(e^{lambda})=h(e^{mu})=mu$.  $Box$

点评  证法一作为 Jordan 标准型的应用, 相对于其他两种证法更易于入手. 虽然证法一篇幅较长, 但证明过程中的分析比较彻底, 由此也得到了更加深刻的结果 (两个推论). 证法二从本质上看应该和证法一是类似的, 比如它们都与 Jordan-Chevalley 分解定理有关联, 在构造多项式表示时都用到了中国剩余定理. 由于证法二是直接引用 Jordan-Chevalley 分解和高代白皮书的例 7.24, 从而证明过程显得更加简洁; 而证法一相当于利用类似的思想去处理新的问题, 所以证明的篇幅较长. 证法三的确十分巧妙, 但从推广的角度来看, 并非是本质的证明. 最后, 在推论 2 中, 若记 $B=e^A$, 则 $A=mathrm{ln}B$ (取定了对数函数的一个单值分支) 可表示为 $B$ 的多项式, 这也是矩阵函数理论中的一个简单结论 (参考 [4] 的第 1 章).

参考文献

[1]  高代教材: 姚慕生, 吴泉水, 谢启鸿 编著, 高等代数学 (第三版), 复旦大学出版社, 2014.

[2]  高代白皮书: 姚慕生, 谢启鸿 编著, 学习方法指导书: 高等代数 (第三版), 复旦大学出版社, 2015.

[3]  楼红卫 编著, 数学分析注记, 高等教育出版社.

[4]  N. J. Higham, Functions of Matrices, Theory and Computation, SIAM, 2008.

原文地址:https://www.cnblogs.com/torsor/p/12258547.html