第8章 方阵的特征值与相似对角化

8.1 特征值与特征向量的概念及计算

特征值的定义及求法

设 $A$ 是 $n$ 阶方阵,$\lambda$ 为变量, $det(\lambda E-A)=0$ 的根叫作 $A$ 的特征值。单根称为单特征值,重根称为重特征值

注意条件"A是方阵"。因此本章大部分概念只对方阵有意义。

特征方程的定义

$det(\lambda E-A)=0$ 为 $A$ 的特征方程

特殊矩阵的特征值

上/下三角形矩阵的特征值是 对角元
对角形矩阵的特征值是 对角元
单位矩阵的特征值是 $\mathbf{1}$ ;
零矩阵的特征值是 $\mathbf{0}$ 。

特征方程的定义

设 $\lambda$ 是 $A$ 的特征值, $(\lambda E-A)p=0$ 的非零解向量叫作 $A$ 的对应于(或属于) $\lambda$ 的特征向量。

注意特征向量需强调非零。并且特征向量与特征值有对应关系。如果不限定线性无关,则每个特征值都有无穷多特征向量。

8.2 特征值与特征向量的性质

核心公式: $\mathbf{n}$ 阶方程的特征多项式

以下几个定理都由此方程推出,用数学归纳法可推出该方程,不要求会证明。

设 $A=(a_{st})$ 是 $n$ 阶方阵,则有

$$
det(\lambda E-A)={\lambda}^{n}-(a_{11}+a_{22}+\cdots+a_{nn}){\lambda}^{n-1}+\cdots+(-1)^{n}\begin{vmatrix}A\end{vmatrix}
$$

迹和特征多项式衍生的5个性质

定义 $tr(A)=a_{11}+a_{22}+\cdots+a_{nn}$ 为 $A$ 的

迹,即方阵A的对角元之和。前提条件为A是方阵。

性质1: $\mathbf{A}$ 在复数域中有且只有 $\mathbf{n}$ 个特征值( $\mathbf{k}$ 重特征值看作 $\mathbf{k}$ 个)

证明:所谓特征值,即为 $det(\lambda E-A)=0$ 的解,即特征多项式的根,而 $n$ 阶方程的特征多项式是个 $n$ 次多项式。根据代数基本定理, $n$ 次多项式一定有且只有 $n$ 个复数根(重根重复计算)。

有关代数基本定理的证明比较复杂,自行查阅资料了解

性质2: $\mathbf{\lambda_{1}+\lambda_{2}+\cdots+\lambda_{n}=tr(A)}$    $\mathbf{\lambda_{1}\lambda_{2}\cdots\lambda_{n}=\begin{vmatrix}\mathbf{A}\end{vmatrix}}$

推论1: $\mathbf{A} $ 可逆 $\mathbf{\Leftrightarrow \lambda_{1}\lambda_{2}\cdots\lambda_{n}\ne 0\Leftrightarrow A}$ 的特征值不都为 $\mathbf{0}$

性质3: $\mathbf{\lambda}$ 是 $\mathbf{A}$ 的特征值, $p$ 是 $\mathbf{A}$ 的对应于 $\mathbf{\lambda}$ 的特征向量 $\Leftrightarrow$ $\mathbf{A}p=\mathbf{\lambda}p$ , $p\ne0$ ,其中 $\mathbf{\lambda}$ 是数, $p$ 是向量。

证明:

$\Rightarrow$ :由已知得 $p$ 是 $(\lambda E-A)x=0$ 的非零解,因此 $p\ne 0$ 且 $(\lambda E-A)p=0$ , $Ap=\lambda p$.

$\Leftarrow$ :由已知得 $(\lambda E-A)p=0$ ,即 $p$ 是 $(\lambda E-A)x=0$ 的非零解。因此, $det(\lambda E-A)=0$ ,$\lambda$ 是 $A$ 的特征值, $p$ 是 $A$ 的对应于 $\lambda$ 的特征向量。

性质4:一些特殊关系

设 $A$ 是可逆矩阵,若 $Ap={\lambda}p$ , $p\ne0$ ,则有:

  1. $A^{-1}p=\lambda^{-1}p$
  2. $A^{*}p=\lambda^{-1}\begin{vmatrix}A\end{vmatrix}p$
  3. $A^kp=\lambda^{k}p$ , $k$是正整数
  4. $f(A)p=f(\lambda)p$
  5. $A$ 与 $A^T$ 的特征值相同。

第3,4,5条中,A不可逆也成立(当然前提是方阵)。

除此以外,方阵的特征值与其秩没有关系。不过,当方阵可相似对角化时(相似对角化的知识在8.4),矩阵的秩等于非零特征值个数(重根重复计算)

若 $A$ 有零特征值,则 $A$ 的列向量组线性相关。

两个定理

定理1:不同特征值对应的特征向量线性无关。

定理2:即使是一个特征值所对应的 $\mathbf{m}$ 个特征向量也线性无关。

即特征方程 $(\lambda E-A)x=0$ 对应的所有特征向量之间都线性无关。

附加:关于迹的拓展

迹的性质

  1. $tr(A+B)=tr(A)+tr(B)$
  2. $tr(kA)=k\cdot tr(A)$
  3. $tr(AB)=tr(BA)$
  4. $tr(A)=\lambda_{1}+\lambda_{2}+\cdots+\lambda_{n}$

其中 $A,B$ 是 $n$ 阶方阵, $k$ 是数,$\lambda_{1},\lambda_{2},\cdots,\lambda_{n}$是 $A$ 的 $n$ 个特征值。

对于第3条,只要求 $A$ 是 $n\times m$ 矩阵, $B$ 是 $m\times n$ 矩阵即可

推论

  1. $x,y$ 是 $n$ 元列向量,有 $tr(xy^T)=tr(y^Tx)=(x,y)$
  2. 相似矩阵的迹相等。即 $tr(P^{-1}AP)=tr(APP^{-1})=tr(A)$

$tr(AB)=tr(BA)的证明$

8.3 方阵的相似对角化

相似及正交相似的定义

若存在可逆阵 $P$ 使得 $B=P^{-1}AP$ ,则称 $A$ 与 $B$ 相似, $P^{-1}AP$ 称为对 $A$ 进行相似变换, $P$ 称为相似变换矩阵

若相似变换矩阵 $P$ 是正交矩阵,则称 $A$ 与 $B$ 正交相似。 $P^{-1}AP$ 称对 $A$ 进行正交相似变换

正交矩阵:满足 $A^TA=E$ 的矩阵。或者描述为 $A$ 的列向量为单位向量(内积为1),且两两正交(互相垂直)。或者描述为 $A^T=A^{-1}$的矩阵。正交矩阵一定是方阵。

若 $A$ 与 $B$ 相似,那么说明 $A$ 可以通过有限次初等变换转化为 $B$ 。即 $A$ 与 $B$ 等价。因此 $A$ 与 $B$ 的秩相等。这说明相似是一种特殊的等价。

相似变换的性质

  1. 反身性:方阵 $A$ 与 $A$ 相似。
  2. 对称性:若 $A$ 与 $B$ 相似,则 $B$ 与 $A$ 相似。
  3. 传递性:若 $A$ 与 $B$ 相似, $B$ 与 $C$ 相似,则 $A$ 与 $C$ 相似。
  4. 若 $A$ 与 $B$ 相似,则 $A$ 与 $B$ 的特征多项式相同,从而特征值相同,迹相等,行列式相等,秩相等。
  5. 若 $A$ 与 $B$ 相似,则 $A^k$ 与 $B^k$ 相似。( $k$ 为正整数)

若两个同阶矩阵特征值相同,则它们相似。

可相似对角化即其成立条件

能 $A$ 能与对角形矩阵相似,则称 $A$ 可相似对角化,与 $A$ 相似的对角形矩阵称为 $A$ 的相似标准形

下面是判断 $A$ 是否可相似对角化的方法:

  • 定理1: $n$ 阶方阵 $A$ 可相似对角化当且仅当 $A$ 有 $n$ 个线性无关的特征向量。
  • 定理2:若 $A$ 的特征值都是单根,则 $A$ 一定可相似对角化。
  • 定理3:重特征值所对应的线性无关特征向量的个数一定不大于其重数。
  • 定理4: $n$ 阶方阵 $A$ 可相似对角化当且仅当 $A$ 的每个特征值所对应的线性无关的特征向量的个数都恰好等于其重数。

求相似变换矩阵的方法:求出 $(\lambda E-A)p=0$ 的所有基础解系(应该有 $n$ 个),则 $P=(p_1,p_2,\cdots,p_n)$。

附加:特殊的矩阵 —— 若尔当块(Jordan)的特殊形态

$$
J_{s}(\lambda)= \left( \begin{array}{c} \lambda & 1 & 0 & \cdots & 0 & 0 \\ 0 & \lambda & 1 & \cdots & 0 & 0 \\ 0 & 0 & \lambda & \cdots & 0 & 0 \\ \vdots & \vdots & \vdots & & \vdots & \vdots \\ 0 & 0 & 0 & \cdots & \lambda & 1 \\ 0 & 0 & 0 & \cdots & 0 & \lambda \\ \end{array} \right)
$$

其中 $s$ 表示阶数。这样的矩阵 $J_s$ 是"若尔当块"的一种特殊形态, $J_s$一定不可相似对角化。

比如,$A_2=\left( \begin{array}{c} 1 & 1 \\ 0 & 1\end{array}\right)$ 不可相似对角化。

$Jordan(若尔当)标准型知识梳理$

8.4 实对称矩阵的性质

共轭矩阵的定义及其运算

设 $A=(a_{ij})_{mn}$ 是复矩阵,则称 $\overline{A}=(\overline{a}_{ij})_{mn}$ 为 $A$ 的共轭矩阵

运算性质:

  1. $\overline{A+B}=\overline{A}+\overline{B}$
  2. $\overline{AB}=\overline{A}\cdot\overline{B}$
  3. $\overline{A^T}=(\overline{A})^T$
  4. $\overline{kA}=\overline{k}\cdot\overline{A}$
  5. $\overline{\alpha}^T\alpha = \begin{vmatrix}a_1\end{vmatrix}^2+\begin{vmatrix}a_2\end{vmatrix}^2+ \cdots +\begin{vmatrix}a_n\end{vmatrix}^2$
  6. $\overline{\alpha}^T\alpha \ge 0$
  7. $\overline{\alpha}^T\alpha = 0 \Leftrightarrow \alpha = 0$

定理1:实对称矩阵的所有特征值都是实数($\mathbf{\overline{\lambda}=\lambda}$)

对称矩阵,即 $A^T=A$ 。实对称矩阵,即再加一条件 $\overline{A}=A$ 。

证明:
已知条件有 $A^T=A$ , $\overline{A}=A$ , 存在特征向量 $p\ne 0$ 和对应的特征值 $\lambda$ 使 $Ap=\lambda p$ .下面证 $\overline{\lambda}=\lambda$ .

$$
A\overline{p}=\overline{A}\overline{p}=\overline{Ap}=\overline{\lambda p}=\overline{\lambda}\overline{p},
$$
$$
\overline{p}^T A=\overline{p}^T A^T =(A\overline{p})^T=\overline{\lambda}\overline{p}^T,
$$
$$
\text{则有}(\lambda-\overline{\lambda})\overline{p}^T p=0;
$$
$$
\text{因为}p\ne0,\overline{p}^T p\ne 0,\text{所以}\overline{\lambda}=\lambda.
$$

注:实对称矩阵的每个特征值都有实特征向量。

定理2:实对称矩阵的不同特征值对应的实特征向量正交

证明:

$$
\text{设 } Ap=\lambda p,Aq=\mu q, p \ne0, q \ne 0.\text{ 下证 }p^Tq=0.
$$
$$
p^TA=p^TA^T=\lambda p^T,
$$
$$
\mu p^Tq=p^TAq=\lambda p^Tq,
$$
$$
(\mu-\lambda)p^Tq=0.
$$
$$
\text{ 因为 }\lambda\ne\mu,\text{ 所以 }p^Tq=0.\text{ 结论得证.}
$$

定理3:实对称矩阵正交相似对角形矩阵

$$
\text{即 }Q^{-1}AQ=Q^TAQ=diag(\lambda_{1},\lambda_{2},\cdots,\lambda_{n})
$$
$$
\text{其中}A\text{为}n\text{阶方阵},\lambda_{1},\lambda_{2},\cdots,\lambda_{n}\text{为}A\text{的n个特征根},Q=(q_{1},q_{2},\cdots,q_{n})\text{是正交矩阵},
$$
$$
\text{而}q_{1},q_{2},\cdots,q_{n}\text{是与特征方程}(\lambda_i E-A)p=0\text{对应的基础解系}p_{1},p_{2},\cdots,p_{n}\text{等价的标准正交向量组.}
$$

推论1:实对称矩阵的每个特征值所对应的线性无关特征向量的个数恰好等于其重数

推论2:两个同阶的实对称矩阵相似的充要条件是它们有相同的特征值

8.5 实对称矩阵的相似对角化

题型1:已知方阵 $\mathbf{A}$ ,求一个正交矩阵 $\mathbf{Q}$ 使得 $\mathbf{Q^{-1}AQ=\Lambda}$ 中的$\mathbf\Lambda$是对角形矩阵

第一步:解 $\begin{vmatrix}(\lambda E-A)\end{vmatrix}=0$ 求出 $A$ 的 $n$ 个特征值 $\lambda_{1},\lambda_{2},\cdots,\lambda_{n}$

第二步:分别把每个特征值 $\lambda_i$ 代入 $A$ 的特征方程 $(\lambda_i E-A)p=0$ ,解出对应的无关特征向量 $p_{1},p_{2},\cdots,p_{n}$

第三步:将 $p_{1},p_{2},\cdots,p_{n}$ 正交化,再单位化得到标准正交基 $q_{1},q_{2},\cdots,q_{n}$

第四步:则 $Q=(q_{1},q_{2},\cdots,q_{n})$. $\Lambda=diag(\lambda_{1},\lambda_{2},\cdots,\lambda_{n}). $

复习:施密特正交化法

对于初始的线性无关的特征向量组 $(\alpha_1,\alpha_2,\cdots,\alpha_n)$ ,运用施密特正交化法得到的正交向量 $(\beta_1,\beta_2,\cdots,\beta_n)$ 计算方法如下:

  • Step1: 令 $\beta_1=\alpha_1$
  • Step2: 做向量 $\alpha_2$ 在向量 $\beta_1=\alpha_1$ 的投影 $\frac{(\beta_1,\alpha_2)}{(\beta_1,\beta_1)}\beta_1$ , 并与 $\alpha_2$ 做差,即
$$
\beta_2=\alpha_2-\frac{(\beta_1,\alpha_2)}{(\beta_1,\beta_1)}\beta_1
$$
  • Step3: 做向量 $\alpha_3$ 在向量 $\beta_1,\beta_2$ 的投影 $\frac{(\beta_1,\alpha_3)}{(\beta_1,\beta_1)}\beta_1,\frac{(\beta_2,\alpha_3)}{(\beta_2,\beta_2)}\beta_2$ , 并与 $\alpha_3$ 做差,即
$$
\beta_3=\alpha_3-\frac{(\beta_1,\alpha_3)}{(\beta_1,\beta_1)}\beta_1-\frac{(\beta_2,\alpha_3)}{(\beta_2,\beta_2)}\beta_2 \\
$$
  • Step4: 做向量 $\alpha_4$ 在向量 $\beta_1,\beta_2,\beta_3$ 的投影 $\frac{(\beta_1,\alpha_4)}{(\beta_1,\beta_1)}\beta_1,\frac{(\beta_2,\alpha_4)}{(\beta_2,\beta_2)}\beta_2,\frac{(\beta_3,\alpha_4)}{(\beta_3,\beta_3)}\beta_3$ ,并与 $\alpha_4$ 做差,即
$$
\\ \beta_4=\alpha_4-\frac{(\beta_1,\alpha_4)}{(\beta_1,\beta_1)}\beta_1-\frac{(\beta_2,\alpha_4)}{(\beta_2,\beta_2)}\beta_2-\frac{(\beta_3,\alpha_4)}{(\beta_3,\beta_3)}\beta_3 \\
$$
  • Step....

关于施密特正交化法的原理,推荐如何理解施密特(Schmidt)正交化