可逆矩阵的极分解定理
一、定理概述
可逆矩阵的极分解定理(Polar Decomposition Theorem)是线性代数中的一个基本且重要的定理。它类似于复数的极坐标表示形式 z=reiθ,将矩阵分解为"旋转"和"伸缩"两个部分。
定理陈述:设 A 是 n×n 的可逆实矩阵(或复矩阵),则存在唯一的分解:
右极分解(Right Polar Decomposition)
A=UP
其中:
- U 是正交矩阵(实矩阵情况下,UTU=I)或酉矩阵(复矩阵情况下,U∗U=I)
- P 是正定对称矩阵(实矩阵情况下)或正定Hermite矩阵(复矩阵情况下)
左极分解(Left Polar Decomposition)
A=QU
其中:
- U 是正交矩阵(或酉矩阵),与右极分解中的 U 相同
- Q 是正定对称矩阵(或正定Hermite矩阵)
二、几何意义
极分解的几何意义非常直观:
-
右极分解 A=UP:
- 首先由 P(正定对称矩阵)进行伸缩和形变
- 然后由 U(正交矩阵)进行旋转(保持长度和角度)
-
左极分解 A=QU:
- 首先由 U 进行旋转
- 然后由 Q 进行伸缩和形变
-
类比复数:
- 复数的极坐标形式:z=reiθ,其中 r>0 是模长,eiθ 表示旋转
- 矩阵的极分解:正定矩阵相当于"模长"(伸缩),正交矩阵相当于"旋转"
三、证明思路
3.1 右极分解的构造
步骤1:考虑矩阵 ATA
- ATA 是对称矩阵(或Hermite矩阵)
- ATA 是半正定的,因为
⟨ATAx,x⟩=⟨Ax,Ax⟩=∥Ax∥2≥0
- 由于 A 可逆,ATA 实际上是正定的
步骤2:定义 P
P=ATA
- 由于 ATA 是正定对称矩阵,存在唯一的正定对称矩阵 P 使得 P2=ATA
- 这个 P 称为 ATA 的正定平方根
步骤3:定义 U
U=AP−1
UTU=(AP−1)T(AP−1)=(P−1)TATAP−1
由于 P 是对称矩阵, P−1 也是对称矩阵, 即 (P−1)T=P−1。又因为 P2=ATA, 所以:
UTU=P−1(ATA)P−1=P−1P2P−1=(P−1P)(PP−1)=I
步骤4:验证分解
A=(AP−1)P=UP
3.2 左极分解的构造
类似地,从 AAT 出发:
步骤1:定义 Q
Q=AAT
- AAT 是正定对称矩阵
- Q 是其唯一的正定平方根
步骤2:定义 U
U=Q−1A
步骤3:得到左分解
A=QU
3.3 两种分解中 U 的一致性和 P,Q 的关系
虽然左右极分解形式不同,但其中的正交矩阵 U 是相同的。而且:
Q=UPUT
这是因为:
AAT=(UP)(UP)T=UPPTUT=UP2UT=U(ATA)UT
因此
Q=UATAUT=UPUT
四、唯一性证明
右极分解的唯一性
假设存在两组分解:
A=U1P1=U2P2
证明 P 的唯一性:
ATA=(U1P1)T(U1P1)=P1TU1TU1P1=P12
同样,
ATA=P22
由于正定对称矩阵的正定平方根是唯一的,所以 P1=P2。
证明 U 的唯一性:
由于 P 唯一且可逆,从 A=UP 得到
U=AP−1
也是唯一的。
左极分解的唯一性
类似地可证明左极分解中 Q 和 U 的唯一性。
五、一般情况的推广
上述讨论针对可逆矩阵。对于一般的 m×n 矩阵 A(不必方阵,不必可逆),极分解定理仍然成立,但需要稍作调整:
一般极分解:对于任意实矩阵 A∈Rm×n,存在分解:
A=UP
其中:
- U∈Rm×n 满足 UTU=In(即 U 的列向量是标准正交的)
- P∈Rn×n 是半正定对称矩阵
如果 rank(A)=n,则 P 是正定的且分解唯一。
六、极分解的计算方法
方法1:通过SVD(奇异值分解)
奇异值分解是计算极分解最有效的方法。
SVD分解:A=VΣWT,其中 V,W 是正交矩阵,Σ 是对角矩阵(对角元素为奇异值)。
右极分解:
- U=VWT(正交矩阵)
- P=WΣWT(正定对称矩阵)
- 验证:UP=(VWT)(WΣWT)=VΣWT=A ✓
左极分解:
- U=VWT(同上)
- Q=VΣVT(正定对称矩阵)
- 验证:QU=(VΣVT)(VWT)=VΣWT=A ✓
方法2:直接计算
右极分解:
- 计算 ATA
- 对 ATA 进行特征值分解:ATA=WΛWT(Λ 是特征值对角矩阵)
- 计算 P=WΛWT
- 计算 U=AP−1
七、重要性质
-
谱性质:
- P 和 Q 的特征值等于 A 的奇异值
- U 的特征值的模长为1(位于单位圆上)
-
行列式关系:
- det(A)=det(U)⋅det(P)=det(U)⋅det(Q)
- 由于 det(U)=±1,所以 ∣det(A)∣=det(P)=det(Q)
-
Frobenius范数:
- ∥A∥F=∥P∥F=∥Q∥F
- 这是因为 ∥A∥F2=tr(ATA),且 P=ATA,所以 ∥P∥F2=tr(P2)=tr(ATA)。
- 同样,∥A∥F2=tr(AAT),而 ∥Q∥F2=tr(Q2)=tr(AAT)。
-
条件数:
- κ(A)=κ(P)=κ(Q)(使用2-范数)
- 因为正交矩阵的条件数为1
八、应用
8.1 数值线性代数
- 矩阵分析:理解矩阵作用的几何结构
- 稳定性分析:正交矩阵具有良好的数值稳定性
- 优化问题:在Procrustes问题中寻找最优正交矩阵
8.2 计算机图形学
- 刚体变换分解:将一般的仿射变换分解为旋转和伸缩
- 动画插值:在变换矩阵之间进行平滑插值
8.3 力学和连续介质力学
- 变形梯度分解:在连续介质力学中,变形梯度张量 F 的极分解 F=RU 将变形分解为旋转 R 和右伸长张量 U
- 应变度量:使用 U 或 Q 来定义应变
8.4 微分几何和李群理论
- 李群分解:GL(n) 群的结构分析
- 对称空间:正定对称矩阵空间的几何结构
九、例题
例1:2×2矩阵的极分解
计算矩阵 A=(2112) 的右极分解。
解:
步骤1:计算 ATA
ATA=(2112)(2112)=(5445)
步骤2:求 ATA 的特征值和特征向量
特征方程:
5−λ445−λ=(5−λ)2−16=0
解得:λ1=9,λ2=1
对应的标准正交特征向量:
- λ1=9:v1=21(11)
- λ2=1:v2=21(1−1)
步骤3:计算 P=ATA
PP=WΛWT=21(111−1)(3001)(111−1)=21(331−1)(111−1)=21(4224)=(2112)
步骤4:计算 U=AP−1
首先计算 P−1:
2112=4−1=3
P−1=31(2−1−12)
因此:
U=AP−1=(2112)⋅31(2−1−12)=31(3003)=I
结论:在这个例子中,A=IP=P,即矩阵 A 本身就是正定对称矩阵,不需要旋转部分。
例2:包含旋转的矩阵
计算矩阵 A=(02−20) 的极分解。
解:
步骤1:计算 ATA
ATA=(0−220)(02−20)=(4004)
步骤2:计算 P=ATA
P=4I=2I=(2002)
步骤3:计算 U=AP−1
U=A⋅21I=21A=(01−10)
验证 U 是正交矩阵:
UTU=(0−110)(01−10)=(1001)=I
✓
结论:A=UP,其中 U=(01−10) 是逆时针旋转90°的旋转矩阵,P=2I 是均匀伸缩2倍。
十、总结
可逆矩阵的极分解定理具有以下特点:
- 存在性与唯一性:对于可逆矩阵,极分解存在且唯一
- 几何意义清晰:将线性变换分解为旋转和伸缩
- 计算方法成熟:通过SVD或直接特征值分解
- 应用广泛:涵盖数值分析、几何学、力学等多个领域
- 理论优美:与复数极坐标、李群理论有深刻联系
极分解定理是理解线性变换结构的重要工具,也是连接代数、几何和分析的桥梁。