Skip to content

5.1 对角化、方阵的特征值与特征向量

对角矩阵的高次幂

2.1 线性方程组和矩阵 中我们介绍过对角矩阵的概念:

Λ=(λ1000λ2000λn)=diag(λ1,λ2,,λn)

我们现在研究对角矩阵的幂。根据矩阵乘法法则,有

Λ2=(λ1λ2λn)(λ1λ2λn)=(λ12λ22λn2)Λ3=(λ12λ22λn2)(λ1λ2λn)=(λ13λ23λn3)

根据数学归纳法可得,对于

Λ=diag(λ1,λ2,,λn)

Λk=diag(λ1k,λ2k,,λnk)

可见,对角矩阵的高次幂是很好求的。可是,如果要求其他方阵的高次幂呢?由此我们引入相似对角化的概念。

相似对角化

定义A,B 都是 n 阶矩阵,若有可逆矩阵 P,使

P1AP=Λ

则称 A 是可对角化的,这一操作称为相似对角化。

那这有什么用呢?

例 1

P=(1111)A=(2112),满足 P1AP=Λ=(1003),求 An

由于

P1AP=Λ

因此有

A=PΛP1

则有

An=(PΛP1)(PΛP1)(PΛP1)n(PΛP1)=PΛnP1=(1111)(1n003n)(1111)1=12(1+3n13n13n1+3n)

因此可对角化的矩阵的高次幂是很好求的。现在的问题变转化为,如何求 PΛ?为此我们引入特征值和特征向量的概念。

特征值与特征向量

定义

An方阵,如果数 λn非零列向量 x 使得关系式

Ax=λx

成立,那么这样的数 λ 称为矩阵 A 的特征值,非零向量 x 称为 A 的对应于特征值 λ 的特征向量

求解

那么我们如何求解 xλ 呢?将定义式变形:

Ax=λxAx=λEx(AλE)x=0

这是一个齐次线性方程组。由于 x0,因此该方程组一定有无穷多解,因此系数矩阵 (AλE) 必定不是满秩的。

3.4 中讲满秩 时我们提过,矩阵可逆是矩阵满秩的充要条件。因此该矩阵是不可逆的。根据 2.3 中可逆的判定,该矩阵不可逆意味着其行列式的值为 0。所以我们有

|AλE|=0

可以看出,对于 n 阶方阵 A|AλE| 是一个 n 次多项式。我们将这个多项式称为方阵 A特征多项式。因此, |AλE|=0 是一个 n 次方程,λn 个根(包括实根和虚根,重根按重数计该方程称为方阵 A特征方程

求出 λ1,λ2,,λn 之后,将其分别带回,相当于求解齐次线性方程组,可以求出 x1,x2,,xn 的通解 kξ1,kξ2,,kξn

|AλE|=0{λ1(Aλ1E)x=0ξ1λ2(Aλ2E)x=0ξ2λn(AλnE)x=0ξn

NOTE

但是这里好像有几个问题……

这里的 λ 是重根的时候怎么办?带回之后,每个方程组的基础解系一定只有一个向量吗?

重根就当一个算。每个方程组的基础解系不一定只有一个向量。这些解均是对应于该特征值的特征向量。

例 2

求矩阵 A=(3113) 的特征值与特征向量。

先求特征值:

|AλE|=|3λ113λ|=(3λ)21=0

解得

λ1=2,λ2=4

再分别求 A 对应于 λ1,λ2 的特征向量:

  1. λ1=2 时,求解

    (A2E)=(1111)r(1100)

    因此有 x1x2=0,设自由变量 x2=k1,有

    x=(x1x2)=k1(11)
  2. λ2=4 时,求解

    (A2E)=(1111)r(1100)

    因此有 x1+x2=0,设自由变量 x2=k2,有

    x=(x1x2)=k2(11)

因此,A 的特征值为 2,4

  • k1(11) 是矩阵 A 的对应于特征值 2 的全部特征向量;
  • k2(11) 是矩阵 A 的对应于特征值 4 的全部特征向量。

其中 k1,k2 是非零任意常数。

单位矩阵 E 的特征值与特征向量

考虑 n 阶单位矩阵 E 的特征方程:

|EλE|=(1λ)n=0

得到 λ1==λn=1。将其带回,得到

Ox=0

这里 x 可以是任意 n 维向量,即该方程的解空间为 Rn

要找 E 的线性无关的特征向量的个数,取 Rn 的任意一个基都满足要求,因此,En 个线性无关的特征向量。

特征值、特征向量与相似对角化的关系

PΛ

我们把前面特征值与特征向量的定义式再拿出来看:

Ax=λx

由于我们有很多的解 x,实际上线性无关的我们取 ξ1,ξ2,,ξn,组成一个矩阵。由于矩阵乘法中,右边这个矩阵的列之间是完全不相干的,所以我们可以得到这个式子:

A(ξ1,ξ2,,ξn)=(λ1ξ1,λ2ξ2,,λnξn)

考虑对等好右边的内容变形。右边的这个矩阵可以看作由 (ξ1,ξ2,,ξn) 经过 n 次倍乘初等列变换得到的(第一列乘以 λ1,第二列乘以 λ2,以此类推根据我们在 3.4 中介绍的初等矩阵的知识,可以将其看成 (ξ1,ξ2,,ξn) 右乘若干个倍加初等阵得到:

(λ1ξ1,λ2ξ2,,λnξn)=(ξ1,ξ2,,ξn)diag(λ1,1,,1)diag(1,λ2,,1)diag(1,1,,λn)

而在 diag(λ1,1,,1) 后面的初等阵又可以看作是对 diag(λ1,1,,1) 进行的初等列变换,因此我们有

(λ1ξ1,λ2ξ2,,λnξn)=(ξ1,ξ2,,ξn)diag(λ1,1,,1)diag(1,λ2,,1)diag(1,1,,λn)=(ξ1,ξ2,,ξn)diag(λ1,λ2,,λn)

已经有感觉了。带回到原来的式子。由于 ξ1,ξ2,,ξn 是线性无关的,因此组成的向量组是满秩的,因此该矩阵可逆。那两边同时左乘 (ξ1,ξ2,,ξn)1

A(ξ1,ξ2,,ξn)=(ξ1,ξ2,,ξn)diag(λ1,λ2,,λn)(ξ1,ξ2,,ξn)1A(ξ1,ξ2,,ξn)=diag(λ1,λ2,,λn)

这就是我们要求的 PΛ,写得再明显一点就是就是:

P=(ξ1,ξ2,,ξn),Λ=diag(λ1,λ2,,λn)P1AP=Λ

WARNING

PΛ 中的 ξiλi 所在的列一定要一一对应。

举例来说,比如

P=(ξ1,ξ2,ξ3),Λ=diag(λ1,λ2,λ3)

也可以写成

P=(ξ3,ξ2,ξ1),Λ=diag(λ3,λ2,λ1)

但不能写成

P=(ξ2,ξ3,ξ1),Λ=diag(λ3,λ2,λ1)

所以前面的例子中,

A=(3113) 的特征值为 2,4

  • k1(11) 是矩阵 A 的对应于特征值 2 的全部特征向量;
  • k2(11) 是矩阵 A 的对应于特征值 4 的全部特征向量。

其对角化形式就可以写成:

P=(1111),Λ=(24)

现在有个自然而然的问题:这些 ξi,能凑到 n 个吗?

相似对角化的条件

例 3

已知矩阵 A=(211020413),判断该矩阵能否相似对角化。

先求特征值:

|AλE|=|2λ1102λ0413λ|=(2λ)(λ2)(λ+1)=0

解得 λ1=1λ2=2λ3=2

再求特征向量:

  1. λ1=1,求解 (A+E)x=0

    (111030414)r(101010000)x=k1(101)

    其中 k1 为任意常数。得基础解系 (101)

  2. λ2=λ3=2,求解 (A+E)x=0

    (411000411)r(411000000)x=k2(140)+k3(104)

    其中 k2,k3 为任意常数。得基础解系 (140)(104)

这里的情形和刚才不太一样。有重根,重根带回解出的基础解系有两个向量。直接按列对应写出:

P=(122),Λ=(111040104)

带到 P1AP=Λ 中,确实是成立的。因此原矩阵是可以对角化的。

例 4

已知矩阵 A=(110430102) 的特征值为 2,1,1,判断该矩阵能否相似对角化。

求特征向量:

  1. λ1=2,求解 (A+E)x=0

    (310410100)r(100010000)x=k1(001)

    其中 k1 为任意常数。得基础解系 (001)

  2. λ2=λ3=1,求解 (A+E)x=0

    (210420101)r(101012000)x=k2(121)

    其中 k2 为任意常数。得基础解系 (121)

这时,最后得到的基础解系总共只有两个向量,没有凑齐 3 个,写不出 P。因此该矩阵无法相似对角化。

这里给出 n 阶方阵 A 可对角化的充要条件:An 个线性无关的特征向量。