线性代数 | 二次型与矩阵谱分解:基于2013年考研数学真题的分析

[toc]

二次型与矩阵谱分解:基于2013年考研数学真题的分析

本文将详细解答2013年考研数学中的一道线性代数题目,并深入探讨其背后涉及的矩阵分解理论。

一、题目回顾

题目 (2013年数学一、三)

f(x1,x2,x3)=2(a1x1+a2x2+a3x3)2+(b1x1+b2x2+b3x3)2f(x_1, x_2, x_3) = 2(a_1x_1 + a_2x_2 + a_3x_3)^2 + (b_1x_1 + b_2x_2 + b_3x_3)^2

记:

α=(a1a2a3),β=(b1b2b3)\alpha = \begin{pmatrix} a_1 \\ a_2 \\ a_3 \end{pmatrix}, \quad \beta = \begin{pmatrix} b_1 \\ b_2 \\ b_3 \end{pmatrix}

(I) 证明二次型 ff 对应的矩阵为 A=2ααT+ββTA = 2\alpha\alpha^T + \beta\beta^T

(II) 若 α,β\alpha, \beta 正交且均为单位向量,证明 ff 在正交变换下的标准形为 2y12+y222y_1^2 + y_2^2


二、考研大纲内常规解法

(I) 证明二次型的矩阵

思路:根据二次型的矩阵表示 f(x)=xTAxf(\mathbf{x}) = \mathbf{x}^T A \mathbf{x},将已知表达式凑成此形式。

证明

x=(x1x2x3)\mathbf{x} = \begin{pmatrix} x_1 \\ x_2 \\ x_3 \end{pmatrix}

给定的二次型 ff 可以写作两个标量内积的平方和:

f(x1,x2,x3)=2(αTx)2+(βTx)2f(x_1, x_2, x_3) = 2(\alpha^T \mathbf{x})^2 + (\beta^T \mathbf{x})^2

由于 αTx\alpha^T \mathbf{x} 是一个标量,它等于其自身的转置,即 αTx=(αTx)T=xTα\alpha^T \mathbf{x} = (\alpha^T \mathbf{x})^T = \mathbf{x}^T \alpha

因此,我们可以改写平方项:

(αTx)2=(αTx)(αTx)=(xTα)(αTx)=xT(ααT)x\begin{aligned} (\alpha^T \mathbf{x})^2 &= (\alpha^T \mathbf{x}) \cdot (\alpha^T \mathbf{x}) = (\mathbf{x}^T \alpha) \cdot (\alpha^T \mathbf{x}) = \mathbf{x}^T (\alpha\alpha^T) \mathbf{x} \end{aligned}

同理:

(βTx)2=xT(ββT)x\begin{aligned} (\beta^T \mathbf{x})^2 &= \mathbf{x}^T (\beta\beta^T) \mathbf{x} \end{aligned}

将上述形式代入原二次型表达式:

f(x)=2[xT(ααT)x]+[xT(ββT)x]f(x)=xT(2ααT)x+xT(ββT)xf(x)=xT(2ααT+ββT)x\begin{aligned} f(\mathbf{x}) &= 2\left[\mathbf{x}^T (\alpha\alpha^T) \mathbf{x}\right] + \left[\mathbf{x}^T (\beta\beta^T) \mathbf{x}\right] \\ f(\mathbf{x}) &= \mathbf{x}^T (2\alpha\alpha^T) \mathbf{x} + \mathbf{x}^T (\beta\beta^T) \mathbf{x} \\ f(\mathbf{x}) &= \mathbf{x}^T (2\alpha\alpha^T + \beta\beta^T) \mathbf{x} \end{aligned}

根据二次型的矩阵定义 f(x)=xTAxf(\mathbf{x}) = \mathbf{x}^T A \mathbf{x},可得其对应的矩阵 AA 为:

A=2ααT+ββT\begin{aligned} A &= 2\alpha\alpha^T + \beta\beta^T \end{aligned}

证毕。

(II) 求解标准形

思路:二次型的标准形由其矩阵的特征值决定。我们需求出矩阵 A=2ααT+ββTA = 2\alpha\alpha^T + \beta\beta^T 的所有特征值。

求解
已知条件:

  1. α,β\alpha, \beta 正交:αTβ=βTα=0\alpha^T \beta = \beta^T \alpha = 0
  2. α,β\alpha, \beta 是单位向量:αTα=1\alpha^T \alpha = 1, βTβ=1\beta^T \beta = 1

我们来寻找矩阵 AA 的特征值和特征向量。
考虑用 AA 左乘向量 α\alpha

Aα=(2ααT+ββT)α=2α(αTα)+β(βTα)\begin{aligned} A\alpha &= (2\alpha\alpha^T + \beta\beta^T)\alpha = 2\alpha(\alpha^T\alpha) + \beta(\beta^T\alpha) \end{aligned}

将已知条件代入:

Aα=2α(1)+β(0)=2α\begin{aligned} A\alpha &= 2\alpha(1) + \beta(0) = 2\alpha \end{aligned}

这是一个标准的特征值定义式 Av=λvA\mathbf{v} = \lambda\mathbf{v}。因此,α\alphaAA 的一个特征向量,对应的特征值 λ1=2\lambda_1 = 2

接下来,用 AA 左乘向量 β\beta

Aβ=(2ααT+ββT)β=2α(αTβ)+β(βTβ)\begin{aligned} A\beta &= (2\alpha\alpha^T + \beta\beta^T)\beta = 2\alpha(\alpha^T\beta) + \beta(\beta^T\beta) \end{aligned}

将已知条件代入:

Aβ=2α(0)+β(1)=β\begin{aligned} A\beta &= 2\alpha(0) + \beta(1) = \beta \end{aligned}

因此,β\betaAA 的一个特征向量,对应的特征值 λ2=1\lambda_2 = 1

矩阵 AA 是一个 3×33 \times 3 矩阵,应该有3个特征值。我们还需要找到第三个特征值。
我们可以通过分析矩阵 AA 的秩来找到它。

  • ααT\alpha\alpha^T 是一个 3×33 \times 3 矩阵,其秩为 rank(ααT)=1\text{rank}(\alpha\alpha^T) = 1
  • ββT\beta\beta^T 也是一个秩为1的矩阵。
  • 由于 α\alphaβ\beta 线性无关(因为它们正交),则 A=2ααT+ββTA = 2\alpha\alpha^T + \beta\beta^T 的秩为 rank(A)=rank(ααT)+rank(ββT)=1+1=2\text{rank}(A) = \text{rank}(\alpha\alpha^T) + \text{rank}(\beta\beta^T) = 1+1=2

对于一个 3×33 \times 3 矩阵,如果秩为2,说明其核(零空间)的维度为 32=13-2=1。这意味着 Ax=0A\mathbf{x} = 0 有非零解,即 AA 有一个特征值为 λ3=0\lambda_3 = 0

综上所述,矩阵 AA 的特征值为 2,1,02, 1, 0

二次型在正交变换下的标准形为

f=λ1y12+λ2y22+λ3y32\begin{aligned} f &= \lambda_1 y_1^2 + \lambda_2 y_2^2 + \lambda_3 y_3^2 \end{aligned}

因此,标准形为:

f=2y12+1y22+0y32=2y12+y22\begin{aligned} f &= 2y_1^2 + 1y_2^2 + 0y_3^2 = 2y_1^2 + y_2^2 \end{aligned}

证毕。


三、方法二:利用谱分解定理求解

如果我们已知谱分解定理,可以用一种更具理论指导性的视角来解决此题。

思路

  1. 根据谱定理,二次型 ff 对应的对称矩阵 AA 一定可以通过正交变换对角化,其标准形由 AA 的特征值唯一确定。
  2. 因此,解题的核心任务就是求出 AA 的所有特征值。
  3. 谱定理还告诉我们,一个 n×nn \times n 对称矩阵有 nn 个线性无关的特征向量。我们可以尝试从矩阵 AA 的构造中寻找这些特征向量。

求解步骤

  1. 寻找特征向量:矩阵 A=2ααT+ββTA = 2\alpha\alpha^T + \beta\beta^T 是由向量 α\alphaβ\beta 构造的。一个自然的想法是,检验 α\alphaβ\beta 是否就是 AA 的特征向量。

    • 计算 Aα=(2ααT+ββT)α=2α(αTα)+β(βTα)=2α(1)+β(0)=2αA\alpha = (2\alpha\alpha^T + \beta\beta^T)\alpha = 2\alpha(\alpha^T\alpha) + \beta(\beta^T\alpha) = 2\alpha(1) + \beta(0) = 2\alpha
      可见 α\alpha 是特征向量,对应特征值 λ1=2\lambda_1 = 2
    • 计算 Aβ=(2ααT+ββT)β=2α(αTβ)+β(βTβ)=2α(0)+β(1)=βA\beta = (2\alpha\alpha^T + \beta\beta^T)\beta = 2\alpha(\alpha^T\beta) + \beta(\beta^T\beta) = 2\alpha(0) + \beta(1) = \beta
      可见 β\beta 是特征向量,对应特征值 λ2=1\lambda_2 = 1
  2. 寻找第三个特征向量:根据谱定理,实对称矩阵的属于不同特征值的特征向量是正交的。我们已经知道 αβ\alpha \perp \beta。对于 3×33 \times 3 矩阵,我们可以找到第三个特征向量 γ\gamma,它与 α\alphaβ\beta 都正交。

    • γ\gamma 为一个与 α,β\alpha, \beta 都正交的非零向量,则有 αTγ=0\alpha^T\gamma=0βTγ=0\beta^T\gamma=0
    • 计算 Aγ=(2ααT+ββT)γ=2α(αTγ)+β(βTγ)=2α(0)+β(0)=0A\gamma = (2\alpha\alpha^T + \beta\beta^T)\gamma = 2\alpha(\alpha^T\gamma) + \beta(\beta^T\gamma) = 2\alpha(0) + \beta(0) = \mathbf{0}
    • Aγ=0γA\gamma = 0\gamma。可见 γ\gamma 是特征向量,对应特征值 λ3=0\lambda_3 = 0
  3. 确定标准形:我们找到了 AA 的全部三个特征值:2,1,02, 1, 0
    二次型在正交变换下的标准形为

f=λ1y12+λ2y22+λ3y32\begin{aligned} f &= \lambda_1 y_1^2 + \lambda_2 y_2^2 + \lambda_3 y_3^2 \end{aligned}

因此,标准形为 

f=2y12+y22\begin{aligned} f &= 2y_1^2 + y_2^2 \end{aligned}

这个解法与常规解法的计算步骤几乎一样,但其每一步都由谱分解定理提供理论依据,思路更加清晰系统。


四、题目核心理论:谱分解定理

这道题是 谱分解定理 (Spectral Theorem) 的一个绝佳应用范例。

谱分解定理指出,任何一个实对称矩阵 AA 都可以表示为其特征值和对应特征向量的加权和:

A=i=1nλiuiuiTA = \sum_{i=1}^{n} \lambda_i \mathbf{u}_i \mathbf{u}_i^T

其中 λi\lambda_i 是特征值,{ui}\{\mathbf{u}_i\} 是一组标准正交的特征向量。

与本题的联系

  1. 矩阵构造:题目中的矩阵 A=2ααT+ββTA = 2\alpha\alpha^T + \beta\beta^T 正是谱分解的加法形式。它由两个秩为1的矩阵 ααT\alpha\alpha^TββT\beta\beta^T 线性组合而成。
  2. 求解过程:我们在解题时,发现 α\alphaβ\beta 正是 AA 的特征向量,其系数 2 和 1 就是对应的特征值。这实际上是逆向运用了谱分解的思想:通过矩阵的构造形式,直接看出了它的特征值和特征向量,从而避免了复杂的特征方程计算。
  3. 理论本质:这道题深刻揭示了对称矩阵的本质——它可以被分解为一系列沿着相互正交方向的“拉伸”,而拉伸的强度就是特征值。本题中的“拉伸”方向就是 α\alphaβ\beta 的方向。

五、总结:实对称矩阵的谱分解结构

通过本题的分析,我们可以深化对实对称矩阵结构的理解。其核心在于谱分解,而非其他形式的分解。

任何一个 n×nn \times n 的实对称矩阵 AA 都可以被看作是一系列相互正交的、秩为1的投影矩阵 (uiuiT)(\mathbf{u}_i \mathbf{u}_i^T) 的加权和,权重就是对应的特征值 λi\lambda_i

A=λ1u1u1T+λ2u2u2T++λnununTA = \lambda_1 \mathbf{u}_1 \mathbf{u}_1^T + \lambda_2 \mathbf{u}_2 \mathbf{u}_2^T + \dots + \lambda_n \mathbf{u}_n \mathbf{u}_n^T

这个结构是实对称矩阵一切优良性质(如可正交对角化)的根源。

本题中的矩阵 A=2ααT+1ββT+0γγTA = 2\alpha\alpha^T + 1\beta\beta^T + 0\gamma\gamma^T (其中 γ\gamma 是与 α,β\alpha, \beta 正交的单位向量),完美地诠释了这一基本结构。