高等数学 | 二元函数极值、海赛矩阵与李亚普诺夫稳定性分析

Prong2025-11-052025-11-05

二元函数极值、海赛矩阵与李亚普诺夫稳定性分析——从一元到二元的推广

一元函数极值与拐点回顾

在分析更复杂的二元函数之前，我们首先回顾一下一元函数中两个核心概念：极值点和拐点的判定法则。这有助于我们理解这些思想如何被推广到更高维度。

1. 极值点 (Local Extrema)

极值点是函数曲线上局部的“山峰”（极大值）或“山谷”（极小值）。

必要条件：若函数 $f(x)$ 在点 $x_0$ 可导且取得极值，则其一阶导数必为零，即 $f'(x_0) = 0$ 。因此，极值的候选点（也称驻点或临界点）是满足 $f'(x_0) = 0$ 或导数不存在的点。
第一充分条件 (一阶导数左右变号)：设函数在 $x_0$ 连续，在 $x_0$ 的去心邻域可导。
- 若在 $x_0$ 左侧 $f'(x) > 0$ 而右侧 $f'(x) < 0$ ，则 $f(x_0)$ 为极大值。
- 若在 $x_0$ 左侧 $f'(x) < 0$ 而右侧 $f'(x) > 0$ ，则 $f(x_0)$ 为极小值。
- 若 $f'(x)$ 在 $x_0$ 两侧符号不变，则不是极值点。
第二充分条件 (一阶导数为零，二阶导数不为零)：设 $f'(x_0) = 0$ 且 $f''(x_0)$ 存在。
- 若 $f''(x_0) < 0$ ，则 $f(x_0)$ 为极大值。
- 若 $f''(x_0) > 0$ ，则 $f(x_0)$ 为极小值。
第 n 阶导数检验法（奇数阶导数为零，偶数阶导数不为零）：若 $f'(x_0) = f''(x_0) = \dots = f^{(n-1)}(x_0) = 0$ ，但 $f^{(n)}(x_0) \neq 0$ ：
- 当 n 为偶数时，若 $f^{(n)}(x_0) < 0$ ，则为极大值；若 $f^{(n)}(x_0) > 0$ ，则为极小值。
- 当 n 为奇数时， $x_0$ 不是极值点。

核心思想：为何高阶导数如此重要？
当 $f''(x_0)=0$ 时，二阶导数检验法会失效。这背后的直观解释是，函数在 $x_0$ 点附近的变化极其平坦，以至于标准的二次近似（像抛物线）已经无法捕捉其真实的弯曲行为。例如函数 $f(x)=x^4$ ，它在 $x=0$ 点比任何抛物线都“平”，因此其二阶导数为零。我们必须借助更高阶的导数（在此例中是四阶导数）才能“看透”这种平坦，发现其依然构成了一个极小值。

2. 拐点 (Inflection Point)

拐点是函数曲线凹凸性发生改变的点，即曲线从“向上凹”变为“向下凹”或反之。

必要条件：若 $(x_0, f(x_0))$ 是拐点且 $f''(x_0)$ 存在，则 $f''(x_0) = 0$ 。因此，拐点的候选点是满足 $f''(x_0) = 0$ 或二阶导数不存在的点。
第一充分条件 (二阶导数变号)：若 $f''(x)$ 在 $x_0$ 两侧异号，则 $(x_0, f(x_0))$ 是拐点。
第二充分条件 (二阶导数为零，三阶导数不为零)：设 $f''(x_0) = 0$ 且 $f'''(x_0) \neq 0$ ，则 $(x_0, f(x_0))$ 是拐点。
第 n 阶导数检验法（偶数阶导数为零，奇数阶导数不为零）：若 $f''(x_0) = \dots = f^{(n-1)}(x_0) = 0$ ，但 $f^{(n)}(x_0) \neq 0$ ：
- 当 n 为奇数 ( $n \ge 3$ ) 时， $(x_0, f(x_0))$ 是拐点。

核心思想：同理
与极值点类似，当 $f'''(x_0)=0$ 时，三阶导数检验法也会失效。例如函数 $f(x)=x^5$ ，它在 $x=0$ 点的变化同样非常平坦，需要通过五阶导数才能确定其拐点性质。

现在，我们将这些思想从一元函数推广到二元函数。

二元函数极值问题陈述

一个二元函数 $ f(x, y) $ 具有二阶连续偏导数，并在点 $ P_0(x_0, y_0) $ 取得极大值。
我们需要回答以下三个问题：

在点 $ P_0 $，$ f_{xx}‘’$ 和 $f_{yy}''$ 的符号是什么（大于零还是小于零）？
这和海赛（Hessian）矩阵有什么关系？
这和李亚普诺夫（Lyapunov）稳定性定理有什么关系？

核心问题回答

对于一个在 $ P_0 $ 点取极大值的二元函数，其二阶偏导数满足：

$f_{xx}''(P_0) < 0 \quad \text{且} \quad f_{yy}''(P_0) < 0$

等于0也可能取极值，这一点在后面会讨论。

下面，我们将通过三种不同的方法来分析和解释这个结论。

方法一：常规方法（二阶偏导数检验法）

这是微积分中最标准的判断二元函数极值的方法。

1. 必要条件

函数在某点取得极值的必要条件是该点为驻点（Critical Point），即它的一阶偏导数（梯度）为零。

$\nabla f(P_0) = \left( \frac{\partial f}{\partial x}(P_0), \frac{\partial f}{\partial y}(P_0) \right) = (0, 0)$

2. 充分条件

为了判断驻点是极大值、极小值还是鞍点，我们需要使用二阶偏导数。记：

$A = f_{xx}''(P_0), \quad B = f_{xy}''(P_0), \quad C = f_{yy}''(P_0)$

并定义判别式：

$\Delta = AC - B^2$

根据二阶偏导数检验法：

如果 $ \Delta > 0 $ 且 $ A < 0 $，则 $ f(P_0) $ 是一个局部极大值。
如果 $ \Delta > 0 $ 且 $ A > 0 $，则 $ f(P_0) $ 是一个局部极小值。
如果 $ \Delta < 0 $，则 $ P_0 $ 是一个鞍点。
如果 $ \Delta = 0 $，则此方法失效，需要更高阶的检验。

4. 检验法失效的情况：与一元函数的类比

我们来探讨当 $\Delta = AC - B^2 = 0$ 时会发生什么，特别是当 $A=f_{xx}''=0$ 且 $C=f_{yy}''=0$ 的情况。

此时，判别式

$\Delta = (0)(0) - (f_{xy}'')^2 = -(f_{xy}'')^2$

若 $f_{xy}'' \neq 0$ ，则 $\Delta < 0$ ，该点明确为鞍点。
若 $f_{xy}'' = 0$ ，则 $\Delta = 0$ ，二阶检验法完全失效。

这个失效的情况，与一元函数中 $f''(x_0)=0$ 的情况是完全对应的。它意味着函数的局部形状过于平坦，无法用一个二次曲面来近似。此时，我们必须通过其他方法来判断。

示例： $f(x, y) = x^4 + y^4$

这是一个经典例子，它是一元函数 $f(x)=x^4$ 在二维空间的直接推广。

驻点： $\nabla f = (4x^3, 4y^3) = (0, 0)$ ，解得驻点为 $(0, 0)$ 。
二阶导数： $f_{xx}'' = 12x^2$ , $f_{yy}'' = 12y^2$ , $f_{xy}'' = 0$ 。
在驻点 $(0, 0)$ ： $A=f_{xx}''(0,0)=0$ , $C=f_{yy}''(0,0)=0$ , $B=f_{xy}''(0,0)=0$ 。
判别式： $\Delta = 0 \cdot 0 - 0^2 = 0$ 。检验法失效。

然而，通过直接分析函数可知， $f(0,0)=0$ 。对于任何不为 $(0,0)$ 的点，都有 $f(x, y) = x^4 + y^4 > 0$ 。因此， $(0,0)$ 点是一个局部极小值点。这个例子清晰地表明，即使二阶偏导数全为零，函数仍然可能取得极值。

3. 结论推导

根据题目，$ P_0 $ 是极大值点，因此必须满足 $ \Delta > 0 $ 且 $ A < 0 $。
即：

$ A = f_{xx}‘’(P_0) < 0 $
$\begin{aligned} AC - B^2 > 0 \implies f_{xx}''(P_0)f_{yy}''(P_0) - [f_{xy}''(P_0)]^2 > 0 \end{aligned}$

从条件2可以推导出

$\begin{aligned} f_{xx}''(P_0)f_{yy}''(P_0) > [f_{xy}''(P_0)]^2 \end{aligned}$

由于 $[f_{xy}''(P_0)]^2 \ge 0$ ，所以 $ f_{xx}‘’(P_0) $ 和 $ f_{yy}‘’(P_0) $ 必须同号。
又因为条件1告诉我们 $ f_{xx}‘’(P_0) < 0 $，所以 $ f_{yy}‘’(P_0) $ 也必须小于零。

因此，通过常规方法，我们证明了在极大值点 $ P_0 $，$ f_{xx}‘’ < 0$ 且 $f_{yy}'' < 0$ 。

方法二：海赛矩阵（Hessian Matrix）法

海赛矩阵提供了一种更系统、更优雅的方式来表达二阶导数检验，并且可以轻松推广到更高维的函数。

1. 海赛矩阵的定义

对于二元函数 $ f(x, y) $，其海赛矩阵是一个 $ 2 \times 2 $ 的对称矩阵，由所有二阶偏导数构成：

$H(f) = \begin{bmatrix} f_{xx}'' & f_{xy}'' \\ f_{yx}'' & f_{yy}'' \end{bmatrix}$

由于函数具有二阶连续偏导数，根据克莱罗定理，$ f_{xy}‘’ = f_{yx}‘’ $。

2. 海赛矩阵与函数极值

函数在驻点 $ P_0 $ 附近的性态由海赛矩阵 $ H(P_0) $ 的定正性决定。

如果 $ H(P_0) $ 是正定的，则 $ f(P_0) $ 是局部极小值。
如果 $ H(P_0) $ 是负定的，则 $ f(P_0) $ 是局部极大值。
如果 $ H(P_0) $ 是不定的（有正有负的特征值），则 $ P_0 $ 是鞍点。

3. 负定矩阵的判定

一个对称矩阵是负定的，当且仅当它的所有顺序主子式（leading principal minors）符号交错，并以负号开头。
对于 $ 2 \times 2 $ 的海赛矩阵 $ H(P_0) $：

一阶顺序主子式：$ D_1 = f_{xx}‘’(P_0) $
二阶顺序主子式：$$
\begin{aligned}
D_2 = \det(H(P_0)) = f_{xx}‘’(P_0)f_{yy}‘’(P_0) - (f_{xy}‘’(P_0))^2
\end{aligned}

$\begin{aligned} D_1 < 0 \implies f_{xx}''(P_0) < 0 \end{aligned}$
$\begin{aligned} D_2 > 0 \implies \det(H(P_0)) > 0 \end{aligned}$

这组条件与方法一中 $ A < 0 $ 和 $ \Delta > 0 $ 是完全等价的。因此，海赛矩阵方法同样导出了 $ f_{xx}‘’ < 0 $ 和 $ f_{yy}‘’ < 0 $ 的结论。海赛矩阵提供了一个更深刻的代数视角，将极值问题与矩阵的性质联系在了一起。

方法三：与李亚普诺夫（Lyapunov）定理的联系

李亚普诺夫稳定性理论是研究动态系统（如微分方程）平衡点稳定性的核心工具。虽然函数求极值是一个静态问题，但我们可以通过构造一个动态系统来建立两者之间的联系。

1. 构造动态系统

我们可以将寻找函数 $ f(x, y) $ 极值的过程看作一个“寻山”或“寻谷”的过程。考虑一个梯度上升系统，其运动方向始终沿着函数值增长最快的方向（梯度方向）：

$\begin{cases} \dot{x} = \frac{dx}{dt} = \frac{\partial f}{\partial x}(x, y) \\ \dot{y} = \frac{dy}{dt} = \frac{\partial f}{\partial y}(x, y) \end{cases} \quad \text{或向量形式} \quad \mathbf{\dot{x}} = \nabla f(\mathbf{x})$

这个系统的平衡点（Equilibrium Points）正是 $ \nabla f(\mathbf{x}) = \mathbf{0} $ 的点，即 $ f(x, y) $ 的驻点。

系统的稳定平衡点对应于 $ f(x, y) $ 的极大值（所有路径最终都会汇集到山顶）。
系统的不稳定平衡点对应于 $ f(x, y) $ 的极小值或鞍点（从山谷或山脊的最高点出发，稍有扰动就会离开）。

2. 李亚普诺夫第一法（线性化方法）

该方法通过分析系统在平衡点 $ \mathbf{x}_0 $（即驻点 $ P_0 $）附近的线性化行为来判断其稳定性。线性化系统的矩阵（雅可比矩阵）为：

$J(\mathbf{x}_0) = \begin{pmatrix} \frac{\partial \dot{x}}{\partial x} & \frac{\partial \dot{x}}{\partial y} \\ \frac{\partial \dot{y}}{\partial x} & \frac{\partial \dot{y}}{\partial y} \end{pmatrix}_{\mathbf{x}=\mathbf{x}_0} = \begin{pmatrix} f_{xx}'' & f_{xy}'' \\ f_{yx}'' & f_{yy}'' \end{pmatrix}_{\mathbf{x}=\mathbf{x}_0} = H(P_0)$

我们发现，这个梯度系统的雅可比矩阵正是函数 $ f $ 的海赛矩阵。

3. 李亚普诺夫稳定性定理

李亚普诺夫稳定性定理指出：

如果雅可比矩阵 $ J(\mathbf{x}_0) $ 的所有特征值的实部都为负，则平衡点 $ \mathbf{x}_0 $ 是渐进稳定的。
如果至少有一个特征值的实部为正，则平衡点是不稳定的。

3. 结论推导

由于 $ P_0 $ 是极大值点，它对应于我们构造的梯度上升系统的稳定平衡点。因此，其雅可比矩阵（即海赛矩阵 $ H(P_0) $）的所有特征值的实部必须为负。

因为 $ H(P_0) $ 是一个实对称矩阵，它的特征值都是实数。所以，条件简化为：$ H(P_0) $ 的所有特征值都必须是负数。

一个矩阵的所有特征值都为负，这正是该矩阵是负定矩阵的定义之一。
对于一个 $ 2 \times 2 $ 矩阵，其特征值 $ \lambda_1, \lambda_2 $ 满足：

$\begin{aligned} \lambda_1 + \lambda_2 = \text{tr}(H) = f_{xx}'' + f_{yy}'' \end{aligned}$
$\begin{aligned} \lambda_1 \lambda_2 = \det(H) = f_{xx}''f_{yy}'' - (f_{xy}'')^2 \end{aligned}$

要使 $ \lambda_1, \lambda_2 $ 均为负数，必须满足：

$\begin{aligned} \lambda_1 + \lambda_2 < 0 \implies f_{xx}'' + f_{yy}'' < 0 \end{aligned}$
$\begin{aligned} \lambda_1 \lambda_2 > 0 \implies \det(H) > 0 \end{aligned}$

这组条件与海赛矩阵负定的条件是等价的，并且同样能推导出 $ f_{xx}‘’ < 0 $ 和 $ f_{yy}‘’ < 0 $。

总结

三种方法从不同角度得到了相同的结论。在二元函数 $ f(x, y) $ 的极大值点 $ P_0 $：

直接结论：$ f_{xx}‘’(P_0) < 0 $ 且 $ f_{yy}‘’(P_0) < 0 $。这在几何上意味着函数曲面在 $ P_0 $ 点沿着坐标轴方向都是“向下凹”的。
与海赛矩阵的关系：条件等价于海赛矩阵 $ H(P_0) $ 是负定的。这是对局部曲率更完整、更本质的代数描述。
与李亚普诺夫定理的关系：通过构造一个梯度上升动态系统，函数的极大值点对应于系统的稳定平衡点。利用李亚普诺夫线性化方法，平衡点的稳定性条件最终归结为其雅可比矩阵（即海赛矩阵）的负定性。这巧妙地将静态优化问题与动态系统稳定性理论联系在了一起。