Skip to content

5.2 相似矩阵

相似的推论

方阵的迹

先补充一个概念:

定义 方阵 A 主对角线上所有元素的和称为该方阵的,记作 tr(A)

例如,方阵

A=(a11a12a1na21a22a2nan1an2ann)

A 的迹 tr(A)

tr(A)=a11+a22++ann

特征值的性质

特征值有如下性质:

  • 特征值的积等于方阵的行列式

    λ1λ2λn=|A|
  • 特征值的和等于方阵的迹

    λ1+λ2++λn=tr(A)

因此我们有

|A|00A

这两个结论的证明略有些复杂,不做强制要求。

特征值的和与积的证明

准备工作 —— 韦达定理的高次推广:

  • 所有根之和为 (n1) 次项系数与 n 次项系数之比的相反数;
  • 所有根之积为常数项与 n 次项系数之比再乘以 (1)n

用符号语言表达就是:对于多项式方程

knxn+kn1xn1++k2x2+k1x+k0=0

{x1+x2++xn=kn1knx1x2xn=(1)nk0kn

下面正式开始。

我们所求的 λ 是特征方程的解

|AλE|=0

这里 λE 前面是负号,我们调整一下舒服一点:

|λEA|=|λa11a12a13a21λa22a2nan1an2λann|=0

所以我们的目标就是,求它化为多项式之后的 kn,kn1,k0 三个系数。

f(λ)=knλn+kn1λn1++k2λ2+k1λ+k0=0

最好求的是 kn。由于这里总共只有 nλ,前面的系数都是 1。要想有 λn,只能是所有 λ 相乘,最后乘完的系数 kn 也一定是 1

而求 k0,我们只要令这个多项式 f(λ)λ 的值为零,那这个多项式的值 f(0) 就等于 k0

k0=f(0)=|0EA|=|A|=(1)n|A|

现在就只剩下 kn1 了。我们现在研究 λn1 会在行列式展开后的哪一项出现。

首先,主对角线上所有元素的乘积里面一定含有 λn1。并且其中的 λn1 一定是 n1λ 乘一个 aii。所以这里的系数是 a11a22ann=tr(A)

其他项还会有 λn1 吗?根据行列式的计算法则,每项中相乘的每个元素均不同行不同列,那么只要这一项中有一个元素不在主对角线上,例如 aijij那么这一项里一定不会出现主对角线第 i 行第 i 列的 λaii 和第 j 行第 j 列的 λajj。换言之,只要有一个元素不在主对角线上,就至少有两个元素不在主对角线上,因此除了主对角线乘积之外,其余的项的次数均小于等于 λn2,所以 λn1 只存在于主对角线乘积这一项里面。所以 kn1=tr(A)

代入韦达定理的推广式,我们有

{λ1+λ2++λn=kn1kn=tr(A)1=tr(A)λ1λ2λn=(1)nk0kn=(1)n(1)n|A|1=|A|

证毕。

例 1

设三阶矩阵 A 的特征值为 2,3,λ,若 |2A|=48,求 λ

解:

|2A|=23|A|=3×2×3λ=48λ=1

特征向量的性质

  • 每个特征值,都至少能提供一个特征向量。
  • 不同特征值的特征向量一定线性无关。

第一个结论是显而易见的。|AλE|=0,就意味着齐次线性方程组 (AλE)x=0 有非零解。

第二个结论证明略有些复杂,不做强制要求。

不同特征值的特征向量一定线性无关的证明

使用反证法。

设对于 n 阶方阵 A,有 n 个不等的特征值,分别为 λ1,,λn,而 x1,,x2 为分别对应着 n 个不同特征值的特征向量。

先假设这些特征向量线性无关,则存在 n 个不全为零的常数 c1,,cn 使得

(1)c1x1+c2x2++cnxn=0

用矩阵 A 左乘上式,根据 Axi=λixi,有

(2)c1λ1x1+c2λ2x2++cnλnxn=0

用式 (2) 减去 λn 倍的式 (1) 来消掉 cnλnxn,得到

c1(λ1λn)x1+c2(λ2λn)x2++cn1(λn1λn)xn1=0

接下来,可将 xi 前面的系数 ci(λiλn) 用常数 di 代替,则上式可以改写成

(3)d1x1+d2x2++dn1xn1=0

注意到该式的形式与 (1) 一致,但是从 n 项变成了 n1 项。我们可以继续按如下步骤处理:

e1x1+e2x2++en2xn2=0f1x1+f2x2++fn3xn3=0g1x1+g2x2++gn4xn4=0

直到处理成

(4)m1(λ1λ3)x1+m2(λ2λ3)x2=0

n1=m1(λ1λ3)n2=m2(λ2λ3)。得到

n1x1+n2x2=0

再进行一次处理,得到

n1(λ1λ2)x1=0

由于特征向量不为零且各特征值都不想等,所以只能是 n1=0。又有 n1=m1(λ1λ3),因此只能是 m1=0。代入式 (4) 中可得 m2=0。如此不断回溯,最终可得

c1=c2==cn=0

这与一开始 ci 不全为零的假设矛盾,因此不同特征值对应的特征向量是线性无关的。证毕。

根据结论二,我们可以引出另一个结论:如果 n 阶矩阵 A 具有 n 个不同的特征值,则矩阵一定可以相似对角化。

特征向量还有一条性质,不过比较废话:属于同一特征值的特征向量的线性组合,仍是该特征值的特征向量。原因很简单,因为特征向量是齐次线性方程组的解,齐次线性方程组的解的线性组合当然还是这个齐次线性方程组的解。

另外还有一个用得很少的推论:属于不同特征值的特征向量的线性组合,不是特征向量。

相关矩阵的特征值与特征向量

设矩阵 A 有特征值 λ,对应特征向量 ξ,则与之相关的矩阵的特征值与对应特征向量如下表:

矩阵AaA+bEAnA1AAT
特征值λaλ+bλn1λ|A|λλ
特征向量ξξξξξ-

下面,已知 Aξ=λξ,我们来验证上述结论。

(aA+bE)ξ=aAξ+bEξ=aλξ+bξ=(aλ+b)ξAnξ=An1Aξ=An1λξ=λAn2Aξ==λnξAξ=λξξ=A1λξA1ξ=1λξA1ξ=1λξAξ=|A|A1ξ=|A|λξ

最后一个 AT 的特征向量不是 ξ。这里只验证 λ 是其特征值。

|ATλE|=|ATλET|=|(AλE)T|=|AλE)|=0

例 2

设三阶矩阵 A 的特征值为 1,2,2E 为三阶单位矩阵,求 |4A1E|

A 的特征值为 1,2,2

A1 的特征值为 1,12,12

4A1E 的特征值为 3,1,1

根据 特征值的积等于行列式,有

|4A1E|=3×1×1=3

例 3

设三阶矩阵 A 的特征值为 1,1,2,求 A+3A2E 的特征值。

根据前面的转换思路,对于 A 的任意特征值 λ,与之对应的 A+3A2E 的特征值可以写成

φ(λ)=|A|λ+3λ2

又有 |A|=1×(1)×2=2,故有

φ(1)=21+32=1φ(1)=2132=3φ(2)=22+62=3

因此 A+3A2E 的特征值为 1,3,3

例 3 改

设三阶矩阵 A 的特征值为 0,1,2,求 A+3A2E 的特征值。

这里的特征值中出现了 λ1=0。这时候代入 φ(λ) 会出现

φ(0)=00+02

这显然是不行的。这里可以做一个投机取巧的处理。

φ(λ1)=λ1λ2λ3λ1+3λ12=λ2λ3+3λ12=1×2+02=4

这件事的深层原因可以有很多解释和证明,这里就不展开了。

其他的特征值用原来的方法求即可。这里不赘述了。

相似矩阵

相似的定义

我们在上一节介绍了相似对角化其实已经触碰到了「相似矩阵」的概念。现在我们完整地介绍相似的定义。

定义A,B 都是 n 阶矩阵,若存在可逆矩阵 P,使得

P1AP=B

则称矩阵 AB 相似。其中,对 A 进行运算 P1AP 称为A 进行相似变换;矩阵 P 称为A 变成 B 的相似变换矩阵

这里,B 就不一定是对角矩阵了。

相似的性质

  • 自反性AA 本身相似;
  • 对称性:若 AB 相似,则 BA 相似;
  • 传递性:若 AB 相似,BC 相似,则 AC 相似。

此外还有两条,但不作要求。

  • AB 相似,f(x) 为矩阵多项式,则 f(A)f(B) 也相似;
  • AB 相似,且 A,B 均可逆,则 A1B1 也相似。

相似矩阵的性质

我们到现在学习了矩阵各种各样的性质,现在回忆一下,和纯「数字」有关的性质有这些:

  • 方阵的行列式
  • 矩阵的秩
  • 方阵的迹
  • 方阵的特征值
  • 方阵的特征多项式

对于相似的矩阵,其数值型性质全部相等。写成符号语言就是

{|A|=|B|R(A)=R(B)tr(A)=tr(B)λA=λb|AλE|=|BλE|

TIP

实际应用求值时,一般按从简单到复杂的顺序选取,通常的顺序为

  1. 行列式

例 4

已知矩阵 A=(2212x2002) 与矩阵 B=(21001000y) 相似。求 x,y

tr(A)=tr(B) 得到

x4=y+1

|A|=|B| 得到

2(2x+4)=2y

联立解得

{x=3y=2

例 5

判断下面两个同阶矩阵是否相似。

A=(111111111),B=(n00100100)

写出 A 的特征方程:

|AλE|=|1λ1111λ1111λ|=(nλ)(λ)n1=0

(忘了这个行列式该怎么算?传送门

得到 A 的特征值:λ1=nλ2==λn=0

λ2==λn=0 时,R(AλE)=R(A)=1,故方程组 (AλE)x=0 的基础解系有 nR(AλE)=n1 个向量。

λ1=n 时,(AλE)x=0 有非零解。因此 A 存在 n 个线性无关的特征向量。

同样方法,也有 B 的特征值 λ1=nλ2==λn=0B 也存在 n 个线性无关的特征向量。

从而,A,B 都可对角化,且存在可逆矩阵 P1,P2 使得

P11AP1=(n00000000)=P21BP2

所以矩阵 A,B 相似。