线性代数 | 可逆矩阵的极分解定理

Prong2025-11-092025-11-09

可逆矩阵的极分解定理

一、定理概述

可逆矩阵的极分解定理（Polar Decomposition Theorem）是线性代数中的一个基本且重要的定理。它类似于复数的极坐标表示形式 $z = re^{i\theta}$ ，将矩阵分解为"旋转"和"伸缩"两个部分。

定理陈述：设 $A$ 是 $n \times n$ 的可逆实矩阵（或复矩阵），则存在唯一的分解：

右极分解（Right Polar Decomposition）

$A = UP$

其中：

$U$ 是正交矩阵（实矩阵情况下， $U^TU = I$ ）或酉矩阵（复矩阵情况下， $U^*U = I$ ）
$P$ 是正定对称矩阵（实矩阵情况下）或正定Hermite矩阵（复矩阵情况下）

左极分解（Left Polar Decomposition）

$A = QU$

其中：

$U$ 是正交矩阵（或酉矩阵），与右极分解中的 $U$ 相同
$Q$ 是正定对称矩阵（或正定Hermite矩阵）

二、几何意义

极分解的几何意义非常直观：

右极分解 $A = UP$ ：
- 首先由 $P$ （正定对称矩阵）进行伸缩和形变
- 然后由 $U$ （正交矩阵）进行旋转（保持长度和角度）
左极分解 $A = QU$ ：
- 首先由 $U$ 进行旋转
- 然后由 $Q$ 进行伸缩和形变
类比复数：
- 复数的极坐标形式： $z = re^{i\theta}$ ，其中 $r > 0$ 是模长， $e^{i\theta}$ 表示旋转
- 矩阵的极分解：正定矩阵相当于"模长"（伸缩），正交矩阵相当于"旋转"

三、证明思路

3.1 右极分解的构造

步骤1：考虑矩阵 $A^TA$

$A^TA$ 是对称矩阵（或Hermite矩阵）
$A^TA$ 是半正定的，因为

$\langle A^TAx, x \rangle = \langle Ax, Ax \rangle = \|Ax\|^2 \geq 0$

由于 $A$ 可逆， $A^TA$ 实际上是正定的

步骤2：定义 $P$

$P = \sqrt{A^TA}$

由于 $A^TA$ 是正定对称矩阵，存在唯一的正定对称矩阵 $P$ 使得 $P^2 = A^TA$
这个 $P$ 称为 $A^TA$ 的正定平方根

步骤3：定义 $U$

$U = AP^{-1}$

验证 $U$ 是正交矩阵：

$U^TU = (AP^{-1})^T(AP^{-1}) = (P^{-1})^TA^TAP^{-1}$

由于 $P$ 是对称矩阵, $P^{-1}$ 也是对称矩阵, 即 $(P^{-1})^T = P^{-1}$ 。又因为 $P^2 = A^TA$ , 所以：

$U^TU = P^{-1}(A^TA)P^{-1} = P^{-1}P^2P^{-1} = (P^{-1}P)(PP^{-1}) = I$

步骤4：验证分解

$A = (AP^{-1})P = UP$

3.2 左极分解的构造

类似地，从 $AA^T$ 出发：

步骤1：定义 $Q$

$Q = \sqrt{AA^T}$

$AA^T$ 是正定对称矩阵
$Q$ 是其唯一的正定平方根

步骤2：定义 $U$

$U = Q^{-1}A$

可以验证 $U$ 是正交矩阵

步骤3：得到左分解

$A = QU$

3.3 两种分解中 $U$ 的一致性和 $P, Q$ 的关系

虽然左右极分解形式不同，但其中的正交矩阵 $U$ 是相同的。而且：

$Q = UPU^T$

这是因为：

$AA^T = (UP)(UP)^T = UPP^TU^T = UP^2U^T = U(A^TA)U^T$

因此

$Q = U\sqrt{A^TA}U^T = UPU^T$

四、唯一性证明

右极分解的唯一性

假设存在两组分解：

$A = U_1P_1 = U_2P_2$

证明 $P$ 的唯一性：

$\begin{aligned} A^TA = (U_1P_1)^T(U_1P_1) = P_1^TU_1^TU_1P_1 = P_1^2 \end{aligned}$

同样，

$A^TA = P_2^2$

由于正定对称矩阵的正定平方根是唯一的，所以 $P_1 = P_2$ 。

证明 $U$ 的唯一性：
由于 $P$ 唯一且可逆，从 $A = UP$ 得到

$\begin{aligned} U = AP^{-1} \end{aligned}$

也是唯一的。

左极分解的唯一性

类似地可证明左极分解中 $Q$ 和 $U$ 的唯一性。

五、一般情况的推广

上述讨论针对可逆矩阵。对于一般的 $m \times n$ 矩阵 $A$ （不必方阵，不必可逆），极分解定理仍然成立，但需要稍作调整：

一般极分解：对于任意实矩阵 $A \in \mathbb{R}^{m \times n}$ ，存在分解：

$A = UP$

其中：

$U \in \mathbb{R}^{m \times n}$ 满足 $U^TU = I_n$ （即 $U$ 的列向量是标准正交的）
$P \in \mathbb{R}^{n \times n}$ 是半正定对称矩阵

如果 $\text{rank}(A) = n$ ，则 $P$ 是正定的且分解唯一。

六、极分解的计算方法

方法1：通过SVD（奇异值分解）

奇异值分解是计算极分解最有效的方法。

SVD分解： $A = V\Sigma W^T$ ，其中 $V, W$ 是正交矩阵， $\Sigma$ 是对角矩阵（对角元素为奇异值）。

右极分解：

$U = VW^T$ （正交矩阵）
$P = W\Sigma W^T$ （正定对称矩阵）
验证： $UP = (VW^T)(W\Sigma W^T) = V\Sigma W^T = A$ ✓

左极分解：

$U = VW^T$ （同上）
$Q = V\Sigma V^T$ （正定对称矩阵）
验证： $QU = (V\Sigma V^T)(VW^T) = V\Sigma W^T = A$ ✓

方法2：直接计算

右极分解：

计算 $A^TA$
对 $A^TA$ 进行特征值分解： $A^TA = W\Lambda W^T$ （ $\Lambda$ 是特征值对角矩阵）
计算 $P = W\sqrt{\Lambda}W^T$
计算 $U = AP^{-1}$

七、重要性质

谱性质：
- $P$ 和 $Q$ 的特征值等于 $A$ 的奇异值
- $U$ 的特征值的模长为1（位于单位圆上）
行列式关系：
- $\det(A) = \det(U) \cdot \det(P) = \det(U) \cdot \det(Q)$
- 由于 $\det(U) = \pm 1$ ，所以 $|\det(A)| = \det(P) = \det(Q)$
Frobenius范数：
- $\|A\|_F = \|P\|_F = \|Q\|_F$
- 这是因为 $\|A\|_F^2 = \text{tr}(A^TA)$ ，且 $P=\sqrt{A^TA}$ ，所以 $\|P\|_F^2 = \text{tr}(P^2) = \text{tr}(A^TA)$ 。
- 同样， $\|A\|_F^2 = \text{tr}(AA^T)$ ，而 $\|Q\|_F^2 = \text{tr}(Q^2) = \text{tr}(AA^T)$ 。
条件数：
- $\kappa(A) = \kappa(P) = \kappa(Q)$ （使用2-范数）
- 因为正交矩阵的条件数为1

八、应用

8.1 数值线性代数

矩阵分析：理解矩阵作用的几何结构
稳定性分析：正交矩阵具有良好的数值稳定性
优化问题：在Procrustes问题中寻找最优正交矩阵

8.2 计算机图形学

刚体变换分解：将一般的仿射变换分解为旋转和伸缩
动画插值：在变换矩阵之间进行平滑插值

8.3 力学和连续介质力学

变形梯度分解：在连续介质力学中，变形梯度张量 $F$ 的极分解 $F = RU$ 将变形分解为旋转 $R$ 和右伸长张量 $U$
应变度量：使用 $U$ 或 $Q$ 来定义应变

8.4 微分几何和李群理论

李群分解： $GL(n)$ 群的结构分析
对称空间：正定对称矩阵空间的几何结构

九、例题

例1：2×2矩阵的极分解

计算矩阵 $A = \begin{pmatrix} 2 & 1 \\ 1 & 2 \end{pmatrix}$ 的右极分解。

解：

步骤1：计算 $A^TA$

$\begin{aligned} A^TA = \begin{pmatrix} 2 & 1 \\ 1 & 2 \end{pmatrix} \begin{pmatrix} 2 & 1 \\ 1 & 2 \end{pmatrix} = \begin{pmatrix} 5 & 4 \\ 4 & 5 \end{pmatrix} \end{aligned}$

步骤2：求 $A^TA$ 的特征值和特征向量

特征方程：

$\begin{aligned} \begin{vmatrix} 5-\lambda & 4 \\ 4 & 5-\lambda \end{vmatrix} = (5-\lambda)^2 - 16 = 0 \end{aligned}$

解得： $\lambda_1 = 9, \lambda_2 = 1$

对应的标准正交特征向量：

$\lambda_1 = 9$ ： $v_1 = \frac{1}{\sqrt{2}}\begin{pmatrix} 1 \\ 1 \end{pmatrix}$
$\lambda_2 = 1$ ： $v_2 = \frac{1}{\sqrt{2}}\begin{pmatrix} 1 \\ -1 \end{pmatrix}$

步骤3：计算 $P = \sqrt{A^TA}$

$\begin{aligned} P &= W\sqrt{\Lambda}W^T = \frac{1}{2}\begin{pmatrix} 1 & 1 \\ 1 & -1 \end{pmatrix} \begin{pmatrix} 3 & 0 \\ 0 & 1 \end{pmatrix} \begin{pmatrix} 1 & 1 \\ 1 & -1 \end{pmatrix}\\ P &= \frac{1}{2}\begin{pmatrix} 3 & 1 \\ 3 & -1 \end{pmatrix} \begin{pmatrix} 1 & 1 \\ 1 & -1 \end{pmatrix} = \frac{1}{2}\begin{pmatrix} 4 & 2 \\ 2 & 4 \end{pmatrix} = \begin{pmatrix} 2 & 1 \\ 1 & 2 \end{pmatrix} \end{aligned}$

步骤4：计算 $U = AP^{-1}$

首先计算 $P^{-1}$ ：

$\begin{aligned} \begin{vmatrix} 2 & 1 \\ 1 & 2 \end{vmatrix} = 4 - 1 = 3 \end{aligned}$

$\begin{aligned} P^{-1} = \frac{1}{3}\begin{pmatrix} 2 & -1 \\ -1 & 2 \end{pmatrix} \end{aligned}$

因此：

$\begin{aligned} U = AP^{-1} = \begin{pmatrix} 2 & 1 \\ 1 & 2 \end{pmatrix} \cdot \frac{1}{3}\begin{pmatrix} 2 & -1 \\ -1 & 2 \end{pmatrix} = \frac{1}{3}\begin{pmatrix} 3 & 0 \\ 0 & 3 \end{pmatrix} = I \end{aligned}$

结论：在这个例子中， $A = IP = P$ ，即矩阵 $A$ 本身就是正定对称矩阵，不需要旋转部分。

例2：包含旋转的矩阵

计算矩阵 $A = \begin{pmatrix} 0 & -2 \\ 2 & 0 \end{pmatrix}$ 的极分解。

解：

步骤1：计算 $A^TA$

$\begin{aligned} A^TA = \begin{pmatrix} 0 & 2 \\ -2 & 0 \end{pmatrix} \begin{pmatrix} 0 & -2 \\ 2 & 0 \end{pmatrix} = \begin{pmatrix} 4 & 0 \\ 0 & 4 \end{pmatrix} \end{aligned}$

步骤2：计算 $P = \sqrt{A^TA}$

$\begin{aligned} P = \sqrt{4I} = 2I = \begin{pmatrix} 2 & 0 \\ 0 & 2 \end{pmatrix} \end{aligned}$

步骤3：计算 $U = AP^{-1}$

$\begin{aligned} U = A \cdot \frac{1}{2}I = \frac{1}{2}A = \begin{pmatrix} 0 & -1 \\ 1 & 0 \end{pmatrix} \end{aligned}$

验证 $U$ 是正交矩阵：

$\begin{aligned} U^TU = \begin{pmatrix} 0 & 1 \\ -1 & 0 \end{pmatrix} \begin{pmatrix} 0 & -1 \\ 1 & 0 \end{pmatrix} = \begin{pmatrix} 1 & 0 \\ 0 & 1 \end{pmatrix} = I \end{aligned}$

✓

结论： $A = UP$ ，其中 $U = \begin{pmatrix} 0 & -1 \\ 1 & 0 \end{pmatrix}$ 是逆时针旋转90°的旋转矩阵， $P = 2I$ 是均匀伸缩2倍。

十、总结

可逆矩阵的极分解定理具有以下特点：

存在性与唯一性：对于可逆矩阵，极分解存在且唯一
几何意义清晰：将线性变换分解为旋转和伸缩
计算方法成熟：通过SVD或直接特征值分解
应用广泛：涵盖数值分析、几何学、力学等多个领域
理论优美：与复数极坐标、李群理论有深刻联系

极分解定理是理解线性变换结构的重要工具，也是连接代数、几何和分析的桥梁。