线性代数 | 可逆矩阵的极分解定理

可逆矩阵的极分解定理

一、定理概述

可逆矩阵的极分解定理(Polar Decomposition Theorem)是线性代数中的一个基本且重要的定理。它类似于复数的极坐标表示形式 z=reiθz = re^{i\theta},将矩阵分解为"旋转"和"伸缩"两个部分。

定理陈述:设 AAn×nn \times n 的可逆实矩阵(或复矩阵),则存在唯一的分解:

右极分解(Right Polar Decomposition)

A=UPA = UP

其中:

  • UU 是正交矩阵(实矩阵情况下,UTU=IU^TU = I)或酉矩阵(复矩阵情况下,UU=IU^*U = I
  • PP 是正定对称矩阵(实矩阵情况下)或正定Hermite矩阵(复矩阵情况下)

左极分解(Left Polar Decomposition)

A=QUA = QU

其中:

  • UU 是正交矩阵(或酉矩阵),与右极分解中的 UU 相同
  • QQ 是正定对称矩阵(或正定Hermite矩阵)

二、几何意义

极分解的几何意义非常直观:

  1. 右极分解 A=UPA = UP

    • 首先由 PP(正定对称矩阵)进行伸缩和形变
    • 然后由 UU(正交矩阵)进行旋转(保持长度和角度)
  2. 左极分解 A=QUA = QU

    • 首先由 UU 进行旋转
    • 然后由 QQ 进行伸缩和形变
  3. 类比复数

    • 复数的极坐标形式:z=reiθz = re^{i\theta},其中 r>0r > 0 是模长,eiθe^{i\theta} 表示旋转
    • 矩阵的极分解:正定矩阵相当于"模长"(伸缩),正交矩阵相当于"旋转"

三、证明思路

3.1 右极分解的构造

步骤1:考虑矩阵 ATAA^TA

  • ATAA^TA 是对称矩阵(或Hermite矩阵)
  • ATAA^TA 是半正定的,因为 $$\langle A^TAx, x \rangle = \langle Ax, Ax \rangle = |Ax|^2 \geq 0$$
  • 由于 AA 可逆,ATAA^TA 实际上是正定的

步骤2:定义 PP

P=ATAP = \sqrt{A^TA}

  • 由于 ATAA^TA 是正定对称矩阵,存在唯一的正定对称矩阵 PP 使得 P2=ATAP^2 = A^TA
  • 这个 PP 称为 ATAA^TA 的正定平方根

步骤3:定义 UU

U=AP1U = AP^{-1}

  • 验证 UU 是正交矩阵:

UTU=(AP1)T(AP1)=(P1)TATAP1U^TU = (AP^{-1})^T(AP^{-1}) = (P^{-1})^TA^TAP^{-1}

由于 PP 是对称矩阵, P1P^{-1} 也是对称矩阵, 即 (P1)T=P1(P^{-1})^T = P^{-1}。又因为 P2=ATAP^2 = A^TA, 所以:

UTU=P1(ATA)P1=P1P2P1=(P1P)(PP1)=IU^TU = P^{-1}(A^TA)P^{-1} = P^{-1}P^2P^{-1} = (P^{-1}P)(PP^{-1}) = I

步骤4:验证分解

A=(AP1)P=UPA = (AP^{-1})P = UP

3.2 左极分解的构造

类似地,从 AATAA^T 出发:

步骤1:定义 QQ

Q=AATQ = \sqrt{AA^T}

  • AATAA^T 是正定对称矩阵
  • QQ 是其唯一的正定平方根

步骤2:定义 UU

U=Q1AU = Q^{-1}A

  • 可以验证 UU 是正交矩阵

步骤3:得到左分解

A=QUA = QU

3.3 两种分解中 UU 的一致性和 P,QP, Q 的关系

虽然左右极分解形式不同,但其中的正交矩阵 UU 是相同的。而且:

Q=UPUTQ = UPU^T

这是因为:

AAT=(UP)(UP)T=UPPTUT=UP2UT=U(ATA)UTAA^T = (UP)(UP)^T = UPP^TU^T = UP^2U^T = U(A^TA)U^T

因此 $$Q = U\sqrt{A^TA}U^T = UPU^T$$

四、唯一性证明

右极分解的唯一性

假设存在两组分解:$$A = U_1P_1 = U_2P_2$$

证明 PP 的唯一性

ATA=(U1P1)T(U1P1)=P1TU1TU1P1=P12\begin{aligned} A^TA = (U_1P_1)^T(U_1P_1) = P_1^TU_1^TU_1P_1 = P_1^2 \end{aligned}

同样,$$A^TA = P_2^2$$。由于正定对称矩阵的正定平方根是唯一的,所以 P1=P2P_1 = P_2

证明 UU 的唯一性
由于 PP 唯一且可逆,从 A=UPA = UP 得到 $$
\begin{aligned}
U = AP^{-1}
\end{aligned}

也是唯一的。 ### 左极分解的唯一性 类似地可证明左极分解中 $Q$ 和 $U$ 的唯一性。 ## 五、一般情况的推广 上述讨论针对可逆矩阵。对于一般的 $m \times n$ 矩阵 $A$(不必方阵,不必可逆),极分解定理仍然成立,但需要稍作调整: **一般极分解**:对于任意实矩阵 $A \in \mathbb{R}^{m \times n}$,存在分解: $$A = UP

其中:

  • URm×nU \in \mathbb{R}^{m \times n} 满足 UTU=InU^TU = I_n(即 UU 的列向量是标准正交的)
  • PRn×nP \in \mathbb{R}^{n \times n} 是半正定对称矩阵

如果 rank(A)=n\text{rank}(A) = n,则 PP 是正定的且分解唯一。

六、极分解的计算方法

方法1:通过SVD(奇异值分解)

奇异值分解是计算极分解最有效的方法。

SVD分解A=VΣWTA = V\Sigma W^T,其中 V,WV, W 是正交矩阵,Σ\Sigma 是对角矩阵(对角元素为奇异值)。

右极分解

  • U=VWTU = VW^T(正交矩阵)
  • P=WΣWTP = W\Sigma W^T(正定对称矩阵)
  • 验证:UP=(VWT)(WΣWT)=VΣWT=AUP = (VW^T)(W\Sigma W^T) = V\Sigma W^T = A

左极分解

  • U=VWTU = VW^T(同上)
  • Q=VΣVTQ = V\Sigma V^T(正定对称矩阵)
  • 验证:QU=(VΣVT)(VWT)=VΣWT=AQU = (V\Sigma V^T)(VW^T) = V\Sigma W^T = A

方法2:直接计算

右极分解

  1. 计算 ATAA^TA
  2. ATAA^TA 进行特征值分解:ATA=WΛWTA^TA = W\Lambda W^TΛ\Lambda 是特征值对角矩阵)
  3. 计算 P=WΛWTP = W\sqrt{\Lambda}W^T
  4. 计算 U=AP1U = AP^{-1}

七、重要性质

  1. 谱性质

    • PPQQ 的特征值等于 AA 的奇异值
    • UU 的特征值的模长为1(位于单位圆上)
  2. 行列式关系

    • det(A)=det(U)det(P)=det(U)det(Q)\det(A) = \det(U) \cdot \det(P) = \det(U) \cdot \det(Q)
    • 由于 det(U)=±1\det(U) = \pm 1,所以 det(A)=det(P)=det(Q)|\det(A)| = \det(P) = \det(Q)
  3. Frobenius范数

    • AF=PF=QF\|A\|_F = \|P\|_F = \|Q\|_F
    • 这是因为 AF2=tr(ATA)\|A\|_F^2 = \text{tr}(A^TA),且 P=ATAP=\sqrt{A^TA},所以 PF2=tr(P2)=tr(ATA)\|P\|_F^2 = \text{tr}(P^2) = \text{tr}(A^TA)
    • 同样,AF2=tr(AAT)\|A\|_F^2 = \text{tr}(AA^T),而 QF2=tr(Q2)=tr(AAT)\|Q\|_F^2 = \text{tr}(Q^2) = \text{tr}(AA^T)
  4. 条件数

    • κ(A)=κ(P)=κ(Q)\kappa(A) = \kappa(P) = \kappa(Q)(使用2-范数)
    • 因为正交矩阵的条件数为1

八、应用

8.1 数值线性代数

  • 矩阵分析:理解矩阵作用的几何结构
  • 稳定性分析:正交矩阵具有良好的数值稳定性
  • 优化问题:在Procrustes问题中寻找最优正交矩阵

8.2 计算机图形学

  • 刚体变换分解:将一般的仿射变换分解为旋转和伸缩
  • 动画插值:在变换矩阵之间进行平滑插值

8.3 力学和连续介质力学

  • 变形梯度分解:在连续介质力学中,变形梯度张量 FF 的极分解 F=RUF = RU 将变形分解为旋转 RR 和右伸长张量 UU
  • 应变度量:使用 UUQQ 来定义应变

8.4 微分几何和李群理论

  • 李群分解GL(n)GL(n) 群的结构分析
  • 对称空间:正定对称矩阵空间的几何结构

九、例题

例1:2×2矩阵的极分解

计算矩阵 A=(2112)A = \begin{pmatrix} 2 & 1 \\ 1 & 2 \end{pmatrix} 的右极分解。

步骤1:计算 ATAA^TA

ATA=(2112)(2112)=(5445)\begin{aligned} A^TA = \begin{pmatrix} 2 & 1 \\ 1 & 2 \end{pmatrix} \begin{pmatrix} 2 & 1 \\ 1 & 2 \end{pmatrix} = \begin{pmatrix} 5 & 4 \\ 4 & 5 \end{pmatrix} \end{aligned}

步骤2:求 ATAA^TA 的特征值和特征向量

特征方程:$$
\begin{aligned}
\det(A^TA - \lambda I) = (5-\lambda)^2 - 16 = 0
\end{aligned}

解得:$\lambda_1 = 9, \lambda_2 = 1$ 对应的标准正交特征向量: - $\lambda_1 = 9$:$v_1 = \frac{1}{\sqrt{2}}\begin{pmatrix} 1 \\ 1 \end{pmatrix}$ - $\lambda_2 = 1$:$v_2 = \frac{1}{\sqrt{2}}\begin{pmatrix} 1 \\ -1 \end{pmatrix}$ **步骤3**:计算 $P = \sqrt{A^TA}$

\begin{aligned}
P &= W\sqrt{\Lambda}W^T = \frac{1}{2}\begin{pmatrix} 1 & 1 \ 1 & -1 \end{pmatrix} \begin{pmatrix} 3 & 0 \ 0 & 1 \end{pmatrix} \begin{pmatrix} 1 & 1 \ 1 & -1 \end{pmatrix}
\end{aligned}

\begin{aligned}
P &= \frac{1}{2}\begin{pmatrix} 3 & 1 \ 3 & -1 \end{pmatrix} \begin{pmatrix} 1 & 1 \ 1 & -1 \end{pmatrix} = \frac{1}{2}\begin{pmatrix} 4 & 2 \ 2 & 4 \end{pmatrix} = \begin{pmatrix} 2 & 1 \ 1 & 2 \end{pmatrix}
\end{aligned}

**步骤4**:计算 $U = AP^{-1}$ 首先计算 $P^{-1}$:

\begin{aligned}
\det§ = 4 - 1 = 3
\end{aligned}

\begin{aligned}
P^{-1} = \frac{1}{3}\begin{pmatrix} 2 & -1 \ -1 & 2 \end{pmatrix}
\end{aligned}

因此: 因此:

\begin{aligned}
U = AP^{-1} = \begin{pmatrix} 2 & 1 \ 1 & 2 \end{pmatrix} \cdot \frac{1}{3}\begin{pmatrix} 2 & -1 \ -1 & 2 \end{pmatrix} = \frac{1}{3}\begin{pmatrix} 3 & 0 \ 0 & 3 \end{pmatrix} = I
\end{aligned}

**结论**:在这个例子中,$A = IP = P$,即矩阵 $A$ 本身就是正定对称矩阵,不需要旋转部分。 ### 例2:包含旋转的矩阵 计算矩阵 $A = \begin{pmatrix} 0 & -2 \\ 2 & 0 \end{pmatrix}$ 的极分解。 **解**: **步骤1**:计算 $A^TA$

\begin{aligned}
A^TA = \begin{pmatrix} 0 & 2 \ -2 & 0 \end{pmatrix} \begin{pmatrix} 0 & -2 \ 2 & 0 \end{pmatrix} = \begin{pmatrix} 4 & 0 \ 0 & 4 \end{pmatrix}
\end{aligned}

**步骤2**:计算 $P = \sqrt{A^TA}$

\begin{aligned}
P = \sqrt{4I} = 2I = \begin{pmatrix} 2 & 0 \ 0 & 2 \end{pmatrix}
\end{aligned}

**步骤3**:计算 $U = AP^{-1}$

\begin{aligned}
U = A \cdot \frac{1}{2}I = \frac{1}{2}A = \begin{pmatrix} 0 & -1 \ 1 & 0 \end{pmatrix}
\end{aligned}

验证 $U$ 是正交矩阵:

\begin{aligned}
U^TU = \begin{pmatrix} 0 & 1 \ -1 & 0 \end{pmatrix} \begin{pmatrix} 0 & -1 \ 1 & 0 \end{pmatrix} = \begin{pmatrix} 1 & 0 \ 0 & 1 \end{pmatrix} = I
\end{aligned}

✓ **结论**:$A = UP$,其中 $U = \begin{pmatrix} 0 & -1 \\ 1 & 0 \end{pmatrix}$ 是逆时针旋转90°的旋转矩阵,$P = 2I$ 是均匀伸缩2倍。 ## 十、总结 可逆矩阵的极分解定理具有以下特点: 1. **存在性与唯一性**:对于可逆矩阵,极分解存在且唯一 2. **几何意义清晰**:将线性变换分解为旋转和伸缩 3. **计算方法成熟**:通过SVD或直接特征值分解 4. **应用广泛**:涵盖数值分析、几何学、力学等多个领域 5. **理论优美**:与复数极坐标、李群理论有深刻联系 极分解定理是理解线性变换结构的重要工具,也是连接代数、几何和分析的桥梁。