条件极值的充分条件与一类椭圆方程

张驰; 程功; 钟海全; 黄华飞

doi:10.13718/j.cnki.xsxb.2019.09.002

摘要: 通过分析无条件极值与条件极值的充分条件具有不同判别矩阵的原因，推导出条件极值充分条件的判别方法，得出其自变量增量间的关系式，得到了多维多约束状态下条件极值充分条件的一种更精确的判别矩阵，并举正反例说明判别驻点时可能出现的情况.有助于理解两种充分条件的关联及差别，提供了一种寻找更精确的条件极值充分条件的判别矩阵的方法.

Abstract: There is rarely discussion on sufficient condition of conditional extreme value of multi-variable function constraint to equalities in most mathematical analysis teaching materials, or with rather complex discussion instead, but conditional extreme value always follows unconditional extreme value tightly, which makes difficult to understand the relevance and difference between two kinds of discriminant matrices of sufficient conditions for students, or in mistake that both of discriminant matrices are in identity. To help students gasp the relevance and difference between both of them profoundly, understand sufficient condition of both problems of extreme value quicker and more comprehensive, sufficient conditions of unconditional and conditional extreme value have been discussed in detail, and different situations may encounter in distinguishing with various kinds of stationary points been explained by examples of validity and invalidity, this can help students understand the problem of extreme value quicker, more profoundly and comprehensively.

Key words:

全文HTML

在很多数学分析的教材中，对于多元函数无条件极值的充分必要条件以及用拉格朗日乘数法解条件极值的必要条件都有详尽的阐述；但对于条件极值的充分条件，则没有详细描述.本文根据文献[1]中的例子，提出一类椭圆方程，说明采用Hesse矩阵判别条件极值的驻点是错误的，接着阐述了为什么采用Hesse矩阵判别无条件极值的驻点是正确的，分析了两种充分条件的判别矩阵的关联与差别，并给出条件极值的充分条件的推导过程.在此基础上，提出一种更精确的判别矩阵—Hesse变形矩阵H_n-m^*，推导出其表达式，并举例说明采用H_n-m^*判别比采用H_n更可靠.最后举出反例，说明本文给出的H_n-m^*仍不能将所有驻点的状态均正确判别，并阐明其原因及解决办法.

1. 引例：一类椭圆方程

例1 设在笛卡尔坐标系中有椭圆方程：

且a≠0，b≠0，b²+2bc≥0，则该椭圆上点到原点的距离必存在极大值和极小值，其中：式(1)是以坐标原点为顶点、x轴为转轴的旋转抛物面；式(2)是以(a，b，b)为一法向，过$\left(\frac{-c}{a}, 0, 0\right), \left(0, \frac{-c}{b}, 0\right)$，$\left(0, 0, \frac{-c}{b}\right)$3点的平面.该椭圆则是两图形的交线，易知其上点到原点的距离必存在极大值和极小值.也可用初等方法证明极值存在，下面给出证明过程.

证设有二次方程Ax²+Bx+C=0，且B²-4AC≥0，所以有实根$x_{1, 2}=\frac{-B \pm \sqrt{B^{2}-4 A C}}{2 A}$，则$x_{1}+x_{2}=\frac{-B}{A}, x_{1} \cdot x_{2}=\frac{C}{A}$.令A=1，则x₁+x₂=-B，x₁·x₂=C.由式(2)可得，$y+z=\frac{-c-a x}{b}$，将其代入式(1)可得$y \cdot z=\frac{\left(\frac{a x+c}{b}\right)^{2}+\frac{a x}{b}}{2}$.因为y，z为椭圆上的坐标，也是实数，所以y，z可看作Ax²+Bx+C=0的两实数根，其中$-B=\frac{-c-a x}{b}$，$C=\frac{\left(\frac{a x+c}{b}\right)^{2}+\frac{a x}{b}}{2}$，则二次方程变为${X^2} + \frac{{ax + c}}{b} \cdot X + \frac{{{{\left({\frac{{ax + c}}{b}} \right)}^2} + \frac{{ax}}{b}}}{2} = 0$.此时满足条件$B^{2}-4 A C=\left(\frac{a x+c}{b}\right)^{2}-2\left[\left(\frac{a x+c}{b}\right)^{2}+\frac{a x}{b}\right] \geqslant 0$，即${a^2}{x^2} + 2a \cdot (b + c) \cdot x + {c^2} \le 0$.又因为a²>0，即二次方程开口向上，所以有

因为式(1)为一旋转抛物面，其上点到原点的距离d为x的严格单调函数，而式(3)表明x存在一个极大值和一个极小值，所以d必存在一个极大值和一个极小值，证毕.

特别地，当c=0，不等式(3)变为$\frac{b}{-a}-\frac{|b|}{|a|} \leqslant x \leqslant \frac{b}{-a}+\frac{|b|}{|a|}$；当$\frac{a}{b}>0$时，$\frac{2 b}{-a} \leqslant x \leqslant 0$；当$\frac{a}{b}$ < 0时，$0 \leqslant x \leqslant \frac{2 b}{-a}$.又当x=0时，代入式(1)可得y=z=0，此时椭圆上点(0，0，0)到原点的距离d₁=0；当$x=\frac{2 b}{-a}$时，代入式(1)，(2)可得y=z=1，此时椭圆上点$\left(\frac{2 b}{-a}, 1, 1\right)$到原点的距离$d_{2}=\sqrt{\frac{4 b^{2}}{a^{2}}+2}>0$.所以可知点(0，0，0)为极小值点，距离的极小值d_min=d₁=0；点$\left(\frac{2 b}{-a}, 1, 1\right)$为极大值点，距离的极大值$d_{\max }=d_{2}=\sqrt{\frac{4 b^{2}}{a^{2}}+2}$.

从上述分析已知该类椭圆上点到原点的距离必存在极大极小值，且给出了c=0时极大极小值的解析表达式.现采用Hesse矩阵来判别c=0时该类椭圆上点到原点的距离是否存在极值.

原问题等价为求目标函数f(x，y，z)=x²+y²+z²在约束条件式(1)，(2)，当c=0时的极值，即此时约束条件为：

作拉格朗日函数$L\left(x, y, z, \lambda_{1}, \lambda_{2}\right)=x^{2}+y^{2}+z^{2}+\lambda_{1}\left[a x+b \cdot\left(y^{2}+z^{2}\right)\right]+\lambda_{2}[a x+b \cdot(y+z)]$，由条件极值的必要性条件^[2]$\frac{\partial L}{\partial x_{i}}=0, \frac{\partial L}{\partial \lambda_{j}}=g_{j}=0$可得：

由式(5)，(6)的对称性可得y=z；将其代入式(8)可得$x=\frac{2 b y}{-a}=\frac{2 b z}{-a}$；将x，y，z的关系式代入式(7)可得y_1，2=z_1，2=0，1，x_1，2=0，$\frac{2 b}{-a}$；将x_1，2，y_1，2代入式(4)，(5)可得λ_11，12=0，$-\frac{2}{b}-\frac{4 b}{a^{2}}$，λ_21，22=0，$\frac{2}{b}$+$\frac{8 b}{a^{2}}$.所以L函数的两个驻点为：

由之前的分析已知点(0，0，0)为极小值点，点$\left(\frac{2 b}{-a}, 1, 1\right)$为极大值点，现用Hesse矩阵H_n来判别这两个驻点.此时$\boldsymbol{H}_{3}=\left[\begin{array}{ccc}{\frac{\partial^{2} L}{\partial x^{2}}} & {\frac{\partial^{2} L}{\partial x \partial y}} & {\frac{\partial^{2} L}{\partial x \partial z}} \\ {\frac{\partial^{2} L}{\partial y \partial x}} & {\frac{\partial^{2} L}{\partial y^{2}}} & {\frac{\partial^{2} L}{\partial y \partial z}} \\ {\frac{\partial^{2} L}{\partial z \partial x}} & {\frac{\partial^{2} L}{\partial z \partial y}} & {\frac{\partial^{2} L}{\partial z^{2}}}\end{array}\right]=\left[\begin{array}{ccc}{2} & {0} & {0} \\ {0} & {2+2 b \lambda_{1}} & {0} \\ {0} & {0} & {2+2 b \lambda_{1}}\end{array}\right]$，当λ₁=λ₁₁=0时，在驻点(0，0，0)处，2>0，2+2bλ₁>0，H₃正定，则该驻点为极小值点^[3]，与证明相符；当$\lambda_{1}=\lambda_{21}=-\frac{2}{b}-\frac{4 b}{a^{2}}$时，2>0，2+2bλ₁ < 0，在驻点$\left(\frac{2 b}{-a}, 1, 1\right)$处，H₃的特征值有正有负，则该驻点为鞍点，与证明矛盾.所以对于该类型的椭圆，当c=0时，采用Hesse矩阵判别驻点状态是错误的.由前述证明过程可类似推导出，当c≠0时，采用Hesse矩阵判别驻点状态也是错误的.

2. Hesse矩阵H_n与Hesse变形矩阵H_n-m^*的不同

对于无条件极值，设目标函数为f(x)，$x \in \mathbb{R}^{n}, n \in \mathbb{N}^{+}$，且设本文中f(x)对每个x_i具有二阶连续偏导数.由无条件极值的必要性条件^[4]，解n个方程$\frac{\partial f}{\partial x_{i}}=0$可得驻点，在任一驻点X⁰处对f(x)作二阶泰勒展开可得：

当dx_i⁰的取值很小时，$o\left(\sum\limits_{i=1}^{n}\left(\mathrm{d} x_{i}^{0}\right)^{2}\right)$是二次型$\mathrm{d} \boldsymbol{X}^{0} \boldsymbol{H}_{n}\left(\mathrm{d} \boldsymbol{X}^{0}\right)^{T}$的高阶无穷小，则Δf与$\mathrm{d} \boldsymbol{X}^{0} \boldsymbol{H}_{n}\left(\mathrm{d} \boldsymbol{X}^{0}\right)^{\mathrm{T}}$同号.若此时H_n正定，则H_n的特征值均大于0，所有$\mathrm{d} \boldsymbol{X}^{0} \boldsymbol{H}_{n}\left(\mathrm{d} \boldsymbol{X}^{0}\right)^{\mathrm{T}}>0$，Δf(x)>0，f(X⁰)取极小值，X⁰为极小值点；若此时H_n负定，则H_n特征值均小于0，所有$\mathrm{d} \boldsymbol{X}^{0} \boldsymbol{H}_{n}\left(\mathrm{d} \boldsymbol{X}^{0}\right)^{\mathrm{T}} < 0$，Δf(x) < 0，f(X⁰)取极大值，X⁰为极大值点；若此时H_n的特征值或正或负，则$\mathrm{d} \boldsymbol{X}^{0} \boldsymbol{H}_{n}\left(\mathrm{d} \boldsymbol{X}^{0}\right)^{\mathrm{T}}$也或正或负，Δf(x)也或正或负，X⁰为鞍点.除此之外的情况需另行讨论驻点X⁰的状态.

下面采用降维思想^[5]，将等式约束条件极值问题用拉格朗日乘数法来求解.只是这时自变量及其增量均受等式约束限制，因而判别极值的矩阵H_n-m^*与H_n有所不同.现设$m \in \mathbb{N}^{+}$，m < n，等式约束有m个：

作拉格朗日函数：

在驻点及其某一邻域内满足条件雅克比矩阵满秩(式(12))，并且满足式(13)

由条件极值的必要性条件，解n+m个方程：$\frac{\partial L}{\partial x_{i}}=0, \frac{\partial L}{\partial \lambda_{j}}=g_{j}=0$，可得驻点.可知任一驻点X⁰=$\left(x_{1}^{0}, \cdots, x_{n}^{0}; \lambda_{1}^{0}, \cdots, \lambda_{m}^{0}\right)$显然满足m个等式约束(10)，即g_j(x)=0；且该驻点处的微小改变量(x₁⁰+dx₁⁰，…，x_n⁰+dx_n⁰)也必须满足这m个等式约束(10)，即g_j(x₁⁰+dx₁⁰，…，x_n⁰+dx_n⁰)=Δg_j=0，则有ΔL=L(x₁⁰+dx₁⁰，…，x_n⁰+dx_n⁰；λ₁⁰+dλ₁⁰，…，λ_m⁰+dλ_m⁰)-L(x₁⁰，…，x_n⁰；λ₁⁰，…，λ_m⁰)=$\Delta f+\sum\limits_{j=1}^{m} \lambda_{j} \Delta g_{j}$=Δf.现对L函数(11)在驻点X⁰处作关于x_i⁰的二阶泰勒展开，此时需将L函数中的λ_j⁰看作常量，可得：

因为在X⁰处有必要性条件$\frac{\partial L}{\partial x_{i}}=0$，可得：

对于条件极值和无条件极值充分条件的差别，其关键在于式(9)和式(14)中$\left[\begin{array}{llll}{\mathrm{d} x_{1}^{0}} & {\mathrm{d} x_{2}^{0}} & {\cdots} & {\mathrm{d} x_{n}^{0}}\end{array}\right]$是不同的：式(9)中n个dx_i⁰均为独立变量；式(14)的n个dx_i⁰中，独立变量只有n-m个，而另外m个非独立变量为这n-m个变量的隐函数^{[1, 6]}.所以必须找到m个非独立变量与n-m个独立变量间更精确的关系式才能更精确地判别极值点.

因此约束(10)在满足式(12)，(13)的驻点X⁰处有泰勒级数：

当dx_i⁰足够小，可令$o(\sqrt{\sum\limits_{i=1}^{n}\left(\mathrm{d} x_{i}^{0}\right)^{2}})=0$，于是解这m个线性方程可得：$\left[\begin{array}{c}{\mathrm{d} x_{1}^{0}} \\ {\mathrm{d} x_{2}^{0}} \\ {\vdots} \\ {\mathrm{d} x_{m}^{0}}\end{array}\right]$=$\left[\begin{array}{cccc}{a_{11}} & {a_{12}} & {\cdots} & {a_{1 n-m}} \\ {a_{21}} & {a_{22}} & {\cdots} & {a_{2 n-m}} \\ {\vdots} & {\vdots} & {\ddots} & {\vdots} \\ {a_{m 1}} & {a_{m 2}} & {\cdots} & {a_{m n-m}}\end{array}\right]\left[\begin{array}{c}{\mathrm{d} x_{m+1}^{0}} \\ {\mathrm{d} x_{m+2}^{0}} \\ {\vdots} \\ {\mathrm{d} x_{m+(n-m)}^{0}}\end{array}\right]$，此时是将$\mathrm{d} x_{m+1}^{0}, \cdots, \mathrm{d} x_{n}^{0}$作为独立变量，其中$\lim\limits _{\mathrm{d} x, \mathrm{d} x_{i}^{0} \rightarrow 0} \frac{\mathrm{d} x}{\mathrm{d} x_{i}^{0}}=c \neq 0$，i=1，…，n.记系数矩阵A_m×(n-m)为：

记单位阵I_n-m为：

记Hesse变形矩阵H_n-m^*为：

则此时可记

当dx_i⁰足够小时，$o\left(\sum\limits_{i=1}^{n}\left(\mathrm{d} x_{i}^{0}\right)^{2}\right)$是二次型YH_n-m^*Y^T的高阶无穷小，Δf与YH_n-m^*Y^T同号.此时若H_n-m^*正定，则H_n-m^*的特征值均大于0，所有YH_n-m^*Y^T>0，Δf(x)>0，f(X⁰)取极小值，驻点X⁰为极小值点；若H_n-m^*负定，H_n-m^*的特征值均小于0，所有YH_n-m^*Y^T < 0，Δf(x) < 0，f(X⁰)取极大值，驻点X⁰为极大值点；若H_n-m^*的特征值或正或负，则YH_n-m^*Y^T或正或负，Δf(x)或正或负，驻点X⁰为鞍点.除此之外的情况需另行讨论驻点X⁰的状态.

下面推导系数矩阵A_m×(n-m)中元素a_jk的表达式以更精确地判别极值.

当n=3，m=2时，有目标函数f(x₁，x₂，x₃)及约束条件(18)，

设此时雅克比行列式为$J_{\left(x_{1}, x_{2}\right)}=\frac{D\left(g_{1}, g_{2}\right)}{D\left(x_{1}, x_{2}\right)}$，即以x₃作为独立变量，此时i=1，2，3，j=1，2，则对等式约束(18)在驻点处作一阶泰勒展开可得：

当n=4，m=2时，有目标函数f(x₁，x₂，x₃，x₄)及约束条件(19)，

此时设雅克比行列式为$J_{\left(x_{1}, x_{2}\right)}=\frac{D\left(g_{1}, g_{2}\right)}{D\left(x_{1}, x_{2}\right)}$，即以x₃，x₄作为独立变量，此时i=1，2，3，4，j=1，2，则对等式约束(19)在驻点处作一阶泰勒展开可得：

继续求解多维多约束的情形，并由数学归纳法可得，$\forall n, m \in \mathbb{N}^{+}$，m < n，k=1，2，…，n-m，当目标函数为f(x)，且f(x)在定义域内对每个x_i具有二阶连续偏导数，有等式约束(10)，L函数(11)于驻点满足条件(12)，(13)时，有式(10)的一阶泰勒级数如下：

1) 当j=1，即所求系数a_1k为A_m×(n-m)第一行的元素时，

2) 当j=m，即所求系数a_mk为A_m×(n-m)最后一行的元素时，

3) 当j=2，3，…，m-1，即所求系数a_jk为A_m×(n-m)中间行的元素时，

现举一例来说明对于等式约束的条件极值采用H_n-m^*判别比采用H_n判别更精确.

例2 对于式(1)，(2)，取a=1，b=c=-1，此时满足条件a≠0，b≠0，b²+2bc≥0，椭圆方程(1)，(2)变为：

求该椭圆上的点到坐标原点距离的极大值及极小值.

由前述证明可知该距离必存在一个极大值和一个极小值，现分别采用H_n和H_n-m^*判别极值.

解原题等价于求目标函数f=x²+y²+z²在等式约束g₁=x-y²-z²=0，g₂=x-y-z-1=0下的极大值和极小值.作L函数L=f+λ₁g₁+λ₂g₂，于是有：

采用与上文相同的求解步骤，得L函数的两个驻点：

此时若采用H_n判别，则有$\boldsymbol{H}_{3}=\left[\begin{array}{ccc}{2} & {0} & {0} \\ {0} & {2-2 \lambda_{1}} & {0} \\ {0} & {0} & {2-2 \lambda_{1}}\end{array}\right]$，当$\lambda_{1}=\lambda_{11}=3+\frac{5}{3} \sqrt{3}$时，2-2λ₁ < 0，2>0，则H₃不定，(x₁，y₁，z₁)为f的鞍点；当$\lambda_{1}=\lambda_{21}=3-\frac{5}{3} \sqrt{3}$时，2-2λ₁>0，2>0，则H₃正定，(x₂，y₂，z₂)为f的极小值点.但此结果与证明相悖，所以改用H_n-m^*判别.因为此时n=3，m=2，点(x₁，y₁，z₁)，(x₂，y₂，z₂)满足条件：$J_{(x, y)}=\frac{D\left(g_{1}, g_{2}\right)}{D(x, y)}=2 y-1 \neq 0$，$\frac{\partial g_{1}}{\partial x}=1 \neq 0, \frac{\partial g_{1}}{\partial y}=-2 y \neq 0, \frac{\partial g_{2}}{\partial x}=1 \neq 0$，$\frac{\partial g_{2}}{\partial y}=-1 \neq 0, \operatorname{Rank}\left(J_{(x, y)}\right)=\operatorname{Rank}\left[\begin{array}{cc}{1} & {-2 y} \\ {1} & {-1}\end{array}\right]=2=m$，所以可采用H_n-m^*判别极值.由式(17)可得，$\boldsymbol{H}_{3-2}^{*}=\left[\begin{array}{ll}{\boldsymbol{A}_{2 \times(3-2)}^{T}} & {\boldsymbol{I}_{3-2}}\end{array}\right] \boldsymbol{H}_{3}\left[\begin{array}{c}{\boldsymbol{A}_{2 \times(3-2)}} \\ {\boldsymbol{I}_{3-2}}\end{array}\right]$，由式(16)可得$\boldsymbol{A}_{2 \times(3-2)}=\left[\begin{array}{l}{a_{11}} \\ {a_{21}}\end{array}\right]$；当j=1时，由式(20)可得， ${a_{11}} = \frac{(-1)^{1}}{J_{(x, y)}} \cdot \frac{D\left(g_{2}, g_{1}\right)}{D\left(x_{3}, x_{2}\right)}=\frac{2 y-2 z}{2 y-1}=0$ $，当j=2=m时，由式(21)可得，$a_{21}=\frac{(-1)^{2}}{J_{(x, y)}} \cdot \frac{D\left(g_{2}, g_{1}\right)}{D\left(x_{1}, x_{3}\right)}=\frac{-2 z+1}{2 y-1}=$-1；所以此时$\boldsymbol{A}_{2 \times(3-2)}=\left[\begin{array}{c}{0} \\ {-1}\end{array}\right]$，$\mathit{\boldsymbol{H}}_{3 - 2}^* = \left[{\begin{array}{*{20}{c}} 0&{ - 1}&1 \end{array}} \right]{\mathit{\boldsymbol{H}}_3}\left[{\begin{array}{*{20}{c}} 0\\ { - 1}\\ 1 \end{array}} \right] = 4\left({1 - {\lambda _1}} \right)$.当$\lambda_{1}=\lambda_{11}=3+\frac{5}{3} \sqrt{3}$时，4(1-λ₁) < 0，则H_3-2^*负定，此时Δf=dz·4(1-λ₁)·dz+ο(dx²+dy²+dz²) < 0，(x₁，y₁，z₁)为f的极大值点，椭圆上的点到原点距离的极大值$\mathrm{d}_{\max }=\sqrt{f_{\max }}=4.63$；当$\lambda_{1}=\lambda_{21}=3-\frac{5}{3} \sqrt{3}$时，4(1-λ₁)>0，则H_3-2^*正定，此时Δf>0，(x₂，y₂，z₂)为f的极小值点，距离的极小值$\mathrm{d}_{\min }=\sqrt{f_{\min }}=0.78$.所以存在一个极大值和一个极小值，与前述证明相符.

3. Hesse变形矩阵H_n-m^*的不足

但采用H_n-m^*并不能将所有等式约束条件极值的驻点状态准确判别，现再举一例.

例3 设有椭圆方程：

求该椭圆上点到原点距离的极大极小值.

解该问题同样可用前文所述初等方法证明极大极小值的存在.现继续采用H_n-m^*判别极值.此时该问题等价为求目标函数f=x²+y²+z²在等式约束$g_{1}=\frac{x+3}{2}-y^{2}-z^{2}=0$，g₂=x-y-z=0下的极大值和极小值.作L函数L=f+λ₁g₁+λ₂g₂，有：

解得L函数的两个驻点为：

此时有$J_{(x, y)}=2 y-\frac{1}{2} \neq 0, \frac{\partial g_{1}}{\partial x}=\frac{1}{2} \neq 0$，$\frac{\partial g_{1}}{\partial y}=-2 y \neq 0, \frac{\partial g_{2}}{\partial x}=1 \neq 0$，$ \frac{\partial g_{2}}{\partial y}=-1 \neq 0 $，Rank(J_(x，y))=$\operatorname{Rank}\left[\begin{array}{cc}{\frac{1}{2}} & {-2 y} \\ {1} & {-1}\end{array}\right]=2=m$，所以可采用H_n-m^*判别极值.当j=1时，由式(20)可得， ${a_{11}} = \frac{{{{(- 1)}^1}}}{{{J_{(x, y)}}}} \cdot \frac{{D\left({{g_2}, {g_1}} \right)}}{{D\left({{x_3}, {x_2}} \right)}} = \frac{{2y - 2z}}{{ - 2y + \frac{1}{2}}} = 0 $，当j=2=m时，由式(21)可得，$a_{21}=\frac{(-1)^{2}}{J_{(x, y)}} \cdot \frac{D\left(g_{2}, g_{1}\right)}{D\left(x_{1}, x_{3}\right)}=\frac{-2 z+\frac{1}{2}}{2 y-\frac{1}{2}}=-1$；所以此时$\boldsymbol{A}_{2 \times(3-2)}=\left[\begin{array}{c}{0} \\ {-1}\end{array}\right]$，$\boldsymbol{H}_{\dot{3}-2}^{*}=\left[\begin{array}{lll}{0} & {-1} & {1}\end{array}\right] \boldsymbol{H}_{3}\left[\begin{array}{c}{0} \\ {-1} \\ {1}\end{array}\right]=4\left(1-\lambda_{1}\right)$.当$ \lambda_{1}=\lambda_{11}=3+\frac{3}{13} / 13 $时，4(1-λ₁) < 0，则H_3-2^*负定，此时Δf < 0，(x₁，y₁，z₁)为f的极大值点；当$\lambda_{1}=\lambda_{21}=3-\frac{3}{13} \sqrt{13}$时，4(1-λ₁) < 0，则H_3-2^*负定，此时Δf < 0，(x₂，y₂，z₂)也为f的极大值点，与实际情况矛盾，此时使用H_n-m^*判定失效.出现这种情况的原因在于式(15)为寻找自变量增量间的解析表达式，对约束条件在驻点处作的一阶泰勒展开，省略了二阶及其以上的高阶无穷小量，因而不是自变量增量间最精确的关系式^[7-8].随着目标函数维数增加，等式约束数目及复杂程度增大，即使只作一阶泰勒展开，求解式(15)中非独立变量关于独立变量的解析表达式已相当复杂，如果将泰勒级数展开到二阶或者更高阶，将更难甚至无法求解出表达式.尽管如此，采用H_n-m^*判别等式约束的条件极值确实比采用H_n更精确，因为用一阶泰勒展开求解了自变量增量间的关系式.

4. 结论

采用Hesse矩阵H_n判别无条件极值的充分条件是准确的，而判别存在等式约束的条件极值的充分条件不够精确；采用本文提出的Hesse变形矩阵H_n-m^*判别后者更精确，因其可判别出一部分被H_n错误判定的驻点.产生这种差别的原因是无条件极值问题的自变量微小增量dx_i间没有约束关系，即所有dx_i均是独立变量；而条件极值问题的自变量微小增量dx_i与m个等式约束有关，n个dx_i中只有n-m个是独立变量，另外m个非独立变量是这n-m个变量的隐函数.

由于对等式约束在驻点处作一阶泰勒展开得到的关系式(15)是在舍弃了二阶及其以上的高阶无穷小量时得到的，即本文得出的非独立变量与独立变量间的关系式并不是最准确的，所以H_n-m^*仍不能将所有驻点的状态均准确判定.若将式(15)式作更高阶的泰勒展开，则可得到更精确的H_n-m^*，从而正确判别出更多驻点的状态；但其解析表达式过于复杂不便推导及表述，寻找系数矩阵A_m×(n-m)的数值解是更有实际意义的.

参考文献 (8)

姓名
	姓名不能为空！
邮箱
	邮箱不能为空！非法的邮箱地址。
手机号码
	电话不能为空！请输入有效手机号!
标题
	标题不能为空！
留言内容
	内容不能为空！
验证码
	验证码不能为空！验证码错误！

[1]	邱伯驺, 李景功, 潘杰.关于用拉格朗日乘数法求条件极值的充分条件[J].大学数学, 1993(S2):26-31. doi: http://www.cnki.com.cn/Article/CJFDTotal-GKSX198503004.htm
[2]	JAMES S.Calculus[M]. 7th Ed.北京:高等教育出版社, 2014:946-962.
[3]	STEVEN J L.Linear Algebra with Application[M]. 9th Ed.北京:机械工业出版社, 2015:351-370.
[4]	周民强, 方企勤.数学分析(第三册)[M].北京:科学出版社, 2014:88-95.
[5]	张芳, 徐文雄.关于约束极值问题降维法的探讨[J].大学数学, 2008(6):130-133. doi: 10.3969/j.issn.1672-1454.2008.06.030
[6]	宁荣健.也谈条件极值问题的充分条件[J].高等数学研究, 2005(2):40-43. doi: 10.3969/j.issn.1008-1399.2005.02.017
[7]	张驰, 胡博, 秦琴, 等.多元函数条件极值的一种较精确的充分条件[J].大理大学学报, 2017, 2(12):5-11. doi: 10.3969/j.issn.2096-2266.2017.12.002
[8]	RICHARD C, FRITZ J.微积分和数学分析引论(第二卷, 第一分册)[M].北京:科学出版社, 2001.

留言板