可逆矩阵的极分解定理
一、定理概述
可逆矩阵的极分解定理(Polar Decomposition Theorem)是线性代数中的一个基本且重要的定理。它类似于复数的极坐标表示形式 z=reiθ,将矩阵分解为"旋转"和"伸缩"两个部分。
定理陈述:设 A 是 n×n 的可逆实矩阵(或复矩阵),则存在唯一的分解:
右极分解(Right Polar Decomposition)
A=UP
其中:
- U 是正交矩阵(实矩阵情况下,UTU=I)或酉矩阵(复矩阵情况下,U∗U=I)
- P 是正定对称矩阵(实矩阵情况下)或正定Hermite矩阵(复矩阵情况下)
左极分解(Left Polar Decomposition)
A=QU
其中:
- U 是正交矩阵(或酉矩阵),与右极分解中的 U 相同
- Q 是正定对称矩阵(或正定Hermite矩阵)
二、几何意义
极分解的几何意义非常直观:
-
右极分解 A=UP:
- 首先由 P(正定对称矩阵)进行伸缩和形变
- 然后由 U(正交矩阵)进行旋转(保持长度和角度)
-
左极分解 A=QU:
- 首先由 U 进行旋转
- 然后由 Q 进行伸缩和形变
-
类比复数:
- 复数的极坐标形式:z=reiθ,其中 r>0 是模长,eiθ 表示旋转
- 矩阵的极分解:正定矩阵相当于"模长"(伸缩),正交矩阵相当于"旋转"
三、证明思路
3.1 右极分解的构造
步骤1:考虑矩阵 ATA
- ATA 是对称矩阵(或Hermite矩阵)
- ATA 是半正定的,因为 $$\langle A^TAx, x \rangle = \langle Ax, Ax \rangle = |Ax|^2 \geq 0$$
- 由于 A 可逆,ATA 实际上是正定的
步骤2:定义 P
P=ATA
- 由于 ATA 是正定对称矩阵,存在唯一的正定对称矩阵 P 使得 P2=ATA
- 这个 P 称为 ATA 的正定平方根
步骤3:定义 U
U=AP−1
UTU=(AP−1)T(AP−1)=(P−1)TATAP−1
由于 P 是对称矩阵, P−1 也是对称矩阵, 即 (P−1)T=P−1。又因为 P2=ATA, 所以:
UTU=P−1(ATA)P−1=P−1P2P−1=(P−1P)(PP−1)=I
步骤4:验证分解
A=(AP−1)P=UP
3.2 左极分解的构造
类似地,从 AAT 出发:
步骤1:定义 Q
Q=AAT
- AAT 是正定对称矩阵
- Q 是其唯一的正定平方根
步骤2:定义 U
U=Q−1A
步骤3:得到左分解
A=QU
3.3 两种分解中 U 的一致性和 P,Q 的关系
虽然左右极分解形式不同,但其中的正交矩阵 U 是相同的。而且:
Q=UPUT
这是因为:
AAT=(UP)(UP)T=UPPTUT=UP2UT=U(ATA)UT
因此 $$Q = U\sqrt{A^TA}U^T = UPU^T$$
四、唯一性证明
右极分解的唯一性
假设存在两组分解:$$A = U_1P_1 = U_2P_2$$
证明 P 的唯一性:
ATA=(U1P1)T(U1P1)=P1TU1TU1P1=P12
同样,$$A^TA = P_2^2$$。由于正定对称矩阵的正定平方根是唯一的,所以 P1=P2。
证明 U 的唯一性:
由于 P 唯一且可逆,从 A=UP 得到 $$
\begin{aligned}
U = AP^{-1}
\end{aligned}
也是唯一的。
### 左极分解的唯一性
类似地可证明左极分解中 $Q$ 和 $U$ 的唯一性。
## 五、一般情况的推广
上述讨论针对可逆矩阵。对于一般的 $m \times n$ 矩阵 $A$(不必方阵,不必可逆),极分解定理仍然成立,但需要稍作调整:
**一般极分解**:对于任意实矩阵 $A \in \mathbb{R}^{m \times n}$,存在分解:
$$A = UP
其中:
- U∈Rm×n 满足 UTU=In(即 U 的列向量是标准正交的)
- P∈Rn×n 是半正定对称矩阵
如果 rank(A)=n,则 P 是正定的且分解唯一。
六、极分解的计算方法
方法1:通过SVD(奇异值分解)
奇异值分解是计算极分解最有效的方法。
SVD分解:A=VΣWT,其中 V,W 是正交矩阵,Σ 是对角矩阵(对角元素为奇异值)。
右极分解:
- U=VWT(正交矩阵)
- P=WΣWT(正定对称矩阵)
- 验证:UP=(VWT)(WΣWT)=VΣWT=A ✓
左极分解:
- U=VWT(同上)
- Q=VΣVT(正定对称矩阵)
- 验证:QU=(VΣVT)(VWT)=VΣWT=A ✓
方法2:直接计算
右极分解:
- 计算 ATA
- 对 ATA 进行特征值分解:ATA=WΛWT(Λ 是特征值对角矩阵)
- 计算 P=WΛWT
- 计算 U=AP−1
七、重要性质
-
谱性质:
- P 和 Q 的特征值等于 A 的奇异值
- U 的特征值的模长为1(位于单位圆上)
-
行列式关系:
- det(A)=det(U)⋅det(P)=det(U)⋅det(Q)
- 由于 det(U)=±1,所以 ∣det(A)∣=det(P)=det(Q)
-
Frobenius范数:
- ∥A∥F=∥P∥F=∥Q∥F
- 这是因为 ∥A∥F2=tr(ATA),且 P=ATA,所以 ∥P∥F2=tr(P2)=tr(ATA)。
- 同样,∥A∥F2=tr(AAT),而 ∥Q∥F2=tr(Q2)=tr(AAT)。
-
条件数:
- κ(A)=κ(P)=κ(Q)(使用2-范数)
- 因为正交矩阵的条件数为1
八、应用
8.1 数值线性代数
- 矩阵分析:理解矩阵作用的几何结构
- 稳定性分析:正交矩阵具有良好的数值稳定性
- 优化问题:在Procrustes问题中寻找最优正交矩阵
8.2 计算机图形学
- 刚体变换分解:将一般的仿射变换分解为旋转和伸缩
- 动画插值:在变换矩阵之间进行平滑插值
8.3 力学和连续介质力学
- 变形梯度分解:在连续介质力学中,变形梯度张量 F 的极分解 F=RU 将变形分解为旋转 R 和右伸长张量 U
- 应变度量:使用 U 或 Q 来定义应变
8.4 微分几何和李群理论
- 李群分解:GL(n) 群的结构分析
- 对称空间:正定对称矩阵空间的几何结构
九、例题
例1:2×2矩阵的极分解
计算矩阵 A=(2112) 的右极分解。
解:
步骤1:计算 ATA
ATA=(2112)(2112)=(5445)
步骤2:求 ATA 的特征值和特征向量
特征方程:$$
\begin{aligned}
\det(A^TA - \lambda I) = (5-\lambda)^2 - 16 = 0
\end{aligned}
解得:$\lambda_1 = 9, \lambda_2 = 1$
对应的标准正交特征向量:
- $\lambda_1 = 9$:$v_1 = \frac{1}{\sqrt{2}}\begin{pmatrix} 1 \\ 1 \end{pmatrix}$
- $\lambda_2 = 1$:$v_2 = \frac{1}{\sqrt{2}}\begin{pmatrix} 1 \\ -1 \end{pmatrix}$
**步骤3**:计算 $P = \sqrt{A^TA}$
\begin{aligned}
P &= W\sqrt{\Lambda}W^T = \frac{1}{2}\begin{pmatrix} 1 & 1 \ 1 & -1 \end{pmatrix} \begin{pmatrix} 3 & 0 \ 0 & 1 \end{pmatrix} \begin{pmatrix} 1 & 1 \ 1 & -1 \end{pmatrix}
\end{aligned}
\begin{aligned}
P &= \frac{1}{2}\begin{pmatrix} 3 & 1 \ 3 & -1 \end{pmatrix} \begin{pmatrix} 1 & 1 \ 1 & -1 \end{pmatrix} = \frac{1}{2}\begin{pmatrix} 4 & 2 \ 2 & 4 \end{pmatrix} = \begin{pmatrix} 2 & 1 \ 1 & 2 \end{pmatrix}
\end{aligned}
**步骤4**:计算 $U = AP^{-1}$
首先计算 $P^{-1}$:
\begin{aligned}
\det§ = 4 - 1 = 3
\end{aligned}
\begin{aligned}
P^{-1} = \frac{1}{3}\begin{pmatrix} 2 & -1 \ -1 & 2 \end{pmatrix}
\end{aligned}
因此:
\begin{aligned}
U = AP^{-1} = \begin{pmatrix} 2 & 1 \ 1 & 2 \end{pmatrix} \cdot \frac{1}{3}\begin{pmatrix} 2 & -1 \ -1 & 2 \end{pmatrix} = \frac{1}{3}\begin{pmatrix} 3 & 0 \ 0 & 3 \end{pmatrix} = I
\end{aligned}
**结论**:在这个例子中,$A = IP = P$,即矩阵 $A$ 本身就是正定对称矩阵,不需要旋转部分。
### 例2:包含旋转的矩阵
计算矩阵 $A = \begin{pmatrix} 0 & -2 \\ 2 & 0 \end{pmatrix}$ 的极分解。
**解**:
**步骤1**:计算 $A^TA$
\begin{aligned}
A^TA = \begin{pmatrix} 0 & 2 \ -2 & 0 \end{pmatrix} \begin{pmatrix} 0 & -2 \ 2 & 0 \end{pmatrix} = \begin{pmatrix} 4 & 0 \ 0 & 4 \end{pmatrix}
\end{aligned}
**步骤2**:计算 $P = \sqrt{A^TA}$
\begin{aligned}
P = \sqrt{4I} = 2I = \begin{pmatrix} 2 & 0 \ 0 & 2 \end{pmatrix}
\end{aligned}
**步骤3**:计算 $U = AP^{-1}$
\begin{aligned}
U = A \cdot \frac{1}{2}I = \frac{1}{2}A = \begin{pmatrix} 0 & -1 \ 1 & 0 \end{pmatrix}
\end{aligned}
验证 $U$ 是正交矩阵:
\begin{aligned}
U^TU = \begin{pmatrix} 0 & 1 \ -1 & 0 \end{pmatrix} \begin{pmatrix} 0 & -1 \ 1 & 0 \end{pmatrix} = \begin{pmatrix} 1 & 0 \ 0 & 1 \end{pmatrix} = I
\end{aligned}
✓
**结论**:$A = UP$,其中 $U = \begin{pmatrix} 0 & -1 \\ 1 & 0 \end{pmatrix}$ 是逆时针旋转90°的旋转矩阵,$P = 2I$ 是均匀伸缩2倍。
## 十、总结
可逆矩阵的极分解定理具有以下特点:
1. **存在性与唯一性**:对于可逆矩阵,极分解存在且唯一
2. **几何意义清晰**:将线性变换分解为旋转和伸缩
3. **计算方法成熟**:通过SVD或直接特征值分解
4. **应用广泛**:涵盖数值分析、几何学、力学等多个领域
5. **理论优美**:与复数极坐标、李群理论有深刻联系
极分解定理是理解线性变换结构的重要工具,也是连接代数、几何和分析的桥梁。