留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

条件极值的充分条件与一类椭圆方程

上一篇

下一篇

张驰, 程功, 钟海全, 等. 条件极值的充分条件与一类椭圆方程[J]. 西南师范大学学报(自然科学版), 2019, 44(9): 6-14. doi: 10.13718/j.cnki.xsxb.2019.09.002
引用本文: 张驰, 程功, 钟海全, 等. 条件极值的充分条件与一类椭圆方程[J]. 西南师范大学学报(自然科学版), 2019, 44(9): 6-14. doi: 10.13718/j.cnki.xsxb.2019.09.002
Chi ZHANG, Gong CHENG, Hai-quan ZHONG, et al. On Sufficient Condition of Conditional Extreme Value and a Kind of Ellipse Equations[J]. Journal of Southwest China Normal University(Natural Science Edition), 2019, 44(9): 6-14. doi: 10.13718/j.cnki.xsxb.2019.09.002
Citation: Chi ZHANG, Gong CHENG, Hai-quan ZHONG, et al. On Sufficient Condition of Conditional Extreme Value and a Kind of Ellipse Equations[J]. Journal of Southwest China Normal University(Natural Science Edition), 2019, 44(9): 6-14. doi: 10.13718/j.cnki.xsxb.2019.09.002

条件极值的充分条件与一类椭圆方程

详细信息
    作者简介:

    张驰(1990-), 男, 硕士, 主要从事最优化方法及时间序列预测算法研究 .

    通讯作者: 程功, 硕士, 高级工程师; 
  • 中图分类号: O172.1

On Sufficient Condition of Conditional Extreme Value and a Kind of Ellipse Equations

  • 摘要: 通过分析无条件极值与条件极值的充分条件具有不同判别矩阵的原因,推导出条件极值充分条件的判别方法,得出其自变量增量间的关系式,得到了多维多约束状态下条件极值充分条件的一种更精确的判别矩阵,并举正反例说明判别驻点时可能出现的情况.有助于理解两种充分条件的关联及差别,提供了一种寻找更精确的条件极值充分条件的判别矩阵的方法.
  • 加载中
  • [1] 邱伯驺, 李景功, 潘杰.关于用拉格朗日乘数法求条件极值的充分条件[J].大学数学, 1993(S2):26-31. doi: http://www.cnki.com.cn/Article/CJFDTotal-GKSX198503004.htm
    [2] JAMES S.Calculus[M]. 7th Ed.北京:高等教育出版社, 2014:946-962.
    [3] STEVEN J L.Linear Algebra with Application[M]. 9th Ed.北京:机械工业出版社, 2015:351-370.
    [4] 周民强, 方企勤.数学分析(第三册)[M].北京:科学出版社, 2014:88-95.
    [5] 张芳, 徐文雄.关于约束极值问题降维法的探讨[J].大学数学, 2008(6):130-133. doi: 10.3969/j.issn.1672-1454.2008.06.030
    [6] 宁荣健.也谈条件极值问题的充分条件[J].高等数学研究, 2005(2):40-43. doi: 10.3969/j.issn.1008-1399.2005.02.017
    [7] 张驰, 胡博, 秦琴, 等.多元函数条件极值的一种较精确的充分条件[J].大理大学学报, 2017, 2(12):5-11. doi: 10.3969/j.issn.2096-2266.2017.12.002
    [8] RICHARD C, FRITZ J.微积分和数学分析引论(第二卷, 第一分册)[M].北京:科学出版社, 2001.
  • 加载中
计量
  • 文章访问数:  1225
  • HTML全文浏览数:  1090
  • PDF下载数:  136
  • 施引文献:  0
出版历程
  • 收稿日期:  2017-01-14
  • 刊出日期:  2019-09-20

条件极值的充分条件与一类椭圆方程

    通讯作者: 程功, 硕士, 高级工程师; 
    作者简介: 张驰(1990-), 男, 硕士, 主要从事最优化方法及时间序列预测算法研究
  • 1. 成都长益西联软件有限公司 智能订货平台部, 成都 610200
  • 2. 广州华立科技职业学院 城建学院, 广州 511325
  • 3. 西南石油大学 油气藏地质及开发工程国家重点实验室, 成都 610500

摘要: 通过分析无条件极值与条件极值的充分条件具有不同判别矩阵的原因,推导出条件极值充分条件的判别方法,得出其自变量增量间的关系式,得到了多维多约束状态下条件极值充分条件的一种更精确的判别矩阵,并举正反例说明判别驻点时可能出现的情况.有助于理解两种充分条件的关联及差别,提供了一种寻找更精确的条件极值充分条件的判别矩阵的方法.

English Abstract

  • 在很多数学分析的教材中,对于多元函数无条件极值的充分必要条件以及用拉格朗日乘数法解条件极值的必要条件都有详尽的阐述;但对于条件极值的充分条件,则没有详细描述.本文根据文献[1]中的例子,提出一类椭圆方程,说明采用Hesse矩阵判别条件极值的驻点是错误的,接着阐述了为什么采用Hesse矩阵判别无条件极值的驻点是正确的,分析了两种充分条件的判别矩阵的关联与差别,并给出条件极值的充分条件的推导过程.在此基础上,提出一种更精确的判别矩阵—Hesse变形矩阵Hn-m*,推导出其表达式,并举例说明采用Hn-m*判别比采用Hn更可靠.最后举出反例,说明本文给出的Hn-m*仍不能将所有驻点的状态均正确判别,并阐明其原因及解决办法.

  • 例1 设在笛卡尔坐标系中有椭圆方程:

    a≠0,b≠0,b2+2bc≥0,则该椭圆上点到原点的距离必存在极大值和极小值,其中:式(1)是以坐标原点为顶点、x轴为转轴的旋转抛物面;式(2)是以(abb)为一法向,过$\left(\frac{-c}{a}, 0, 0\right), \left(0, \frac{-c}{b}, 0\right)$$\left(0, 0, \frac{-c}{b}\right)$3点的平面.该椭圆则是两图形的交线,易知其上点到原点的距离必存在极大值和极小值.也可用初等方法证明极值存在,下面给出证明过程.

     设有二次方程Ax2+Bx+C=0,且B2-4AC≥0,所以有实根$x_{1, 2}=\frac{-B \pm \sqrt{B^{2}-4 A C}}{2 A}$,则$x_{1}+x_{2}=\frac{-B}{A}, x_{1} \cdot x_{2}=\frac{C}{A}$.令A=1,则x1+x2=-Bx1·x2=C.由式(2)可得,$y+z=\frac{-c-a x}{b}$,将其代入式(1)可得$y \cdot z=\frac{\left(\frac{a x+c}{b}\right)^{2}+\frac{a x}{b}}{2}$.因为yz为椭圆上的坐标,也是实数,所以yz可看作Ax2+Bx+C=0的两实数根,其中$-B=\frac{-c-a x}{b}$$C=\frac{\left(\frac{a x+c}{b}\right)^{2}+\frac{a x}{b}}{2}$,则二次方程变为${X^2} + \frac{{ax + c}}{b} \cdot X + \frac{{{{\left({\frac{{ax + c}}{b}} \right)}^2} + \frac{{ax}}{b}}}{2} = 0$.此时满足条件$B^{2}-4 A C=\left(\frac{a x+c}{b}\right)^{2}-2\left[\left(\frac{a x+c}{b}\right)^{2}+\frac{a x}{b}\right] \geqslant 0$,即${a^2}{x^2} + 2a \cdot (b + c) \cdot x + {c^2} \le 0$.又因为a2>0,即二次方程开口向上,所以有

    因为式(1)为一旋转抛物面,其上点到原点的距离dx的严格单调函数,而式(3)表明x存在一个极大值和一个极小值,所以d必存在一个极大值和一个极小值,证毕.

    特别地,当c=0,不等式(3)变为$\frac{b}{-a}-\frac{|b|}{|a|} \leqslant x \leqslant \frac{b}{-a}+\frac{|b|}{|a|}$;当$\frac{a}{b}>0$时,$\frac{2 b}{-a} \leqslant x \leqslant 0$;当$\frac{a}{b}$ < 0时,$0 \leqslant x \leqslant \frac{2 b}{-a}$.又当x=0时,代入式(1)可得y=z=0,此时椭圆上点(0,0,0)到原点的距离d1=0;当$x=\frac{2 b}{-a}$时,代入式(1),(2)可得y=z=1,此时椭圆上点$\left(\frac{2 b}{-a}, 1, 1\right)$到原点的距离$d_{2}=\sqrt{\frac{4 b^{2}}{a^{2}}+2}>0$.所以可知点(0,0,0)为极小值点,距离的极小值dmin=d1=0;点$\left(\frac{2 b}{-a}, 1, 1\right)$为极大值点,距离的极大值$d_{\max }=d_{2}=\sqrt{\frac{4 b^{2}}{a^{2}}+2}$.

    从上述分析已知该类椭圆上点到原点的距离必存在极大极小值,且给出了c=0时极大极小值的解析表达式.现采用Hesse矩阵来判别c=0时该类椭圆上点到原点的距离是否存在极值.

    原问题等价为求目标函数f(xyz)=x2+y2+z2在约束条件式(1),(2),当c=0时的极值,即此时约束条件为:

    作拉格朗日函数$L\left(x, y, z, \lambda_{1}, \lambda_{2}\right)=x^{2}+y^{2}+z^{2}+\lambda_{1}\left[a x+b \cdot\left(y^{2}+z^{2}\right)\right]+\lambda_{2}[a x+b \cdot(y+z)]$,由条件极值的必要性条件[2]$\frac{\partial L}{\partial x_{i}}=0, \frac{\partial L}{\partial \lambda_{j}}=g_{j}=0$可得:

    由式(5),(6)的对称性可得y=z;将其代入式(8)可得$x=\frac{2 b y}{-a}=\frac{2 b z}{-a}$;将xyz的关系式代入式(7)可得y1,2=z1,2=0,1,x1,2=0,$\frac{2 b}{-a}$;将x1,2y1,2代入式(4),(5)可得λ11,12=0,$-\frac{2}{b}-\frac{4 b}{a^{2}}$λ21,22=0,$\frac{2}{b}$+$\frac{8 b}{a^{2}}$.所以L函数的两个驻点为:

    由之前的分析已知点(0,0,0)为极小值点,点$\left(\frac{2 b}{-a}, 1, 1\right)$为极大值点,现用Hesse矩阵Hn来判别这两个驻点.此时$\boldsymbol{H}_{3}=\left[\begin{array}{ccc}{\frac{\partial^{2} L}{\partial x^{2}}} & {\frac{\partial^{2} L}{\partial x \partial y}} & {\frac{\partial^{2} L}{\partial x \partial z}} \\ {\frac{\partial^{2} L}{\partial y \partial x}} & {\frac{\partial^{2} L}{\partial y^{2}}} & {\frac{\partial^{2} L}{\partial y \partial z}} \\ {\frac{\partial^{2} L}{\partial z \partial x}} & {\frac{\partial^{2} L}{\partial z \partial y}} & {\frac{\partial^{2} L}{\partial z^{2}}}\end{array}\right]=\left[\begin{array}{ccc}{2} & {0} & {0} \\ {0} & {2+2 b \lambda_{1}} & {0} \\ {0} & {0} & {2+2 b \lambda_{1}}\end{array}\right]$,当λ1=λ11=0时,在驻点(0,0,0)处,2>0,2+21>0,H3正定,则该驻点为极小值点[3],与证明相符;当$\lambda_{1}=\lambda_{21}=-\frac{2}{b}-\frac{4 b}{a^{2}}$时,2>0,2+21 < 0,在驻点$\left(\frac{2 b}{-a}, 1, 1\right)$处,H3的特征值有正有负,则该驻点为鞍点,与证明矛盾.所以对于该类型的椭圆,当c=0时,采用Hesse矩阵判别驻点状态是错误的.由前述证明过程可类似推导出,当c≠0时,采用Hesse矩阵判别驻点状态也是错误的.

  • 对于无条件极值,设目标函数为f(x),$x \in \mathbb{R}^{n}, n \in \mathbb{N}^{+}$,且设本文中f(x)对每个xi具有二阶连续偏导数.由无条件极值的必要性条件[4],解n个方程$\frac{\partial f}{\partial x_{i}}=0$可得驻点,在任一驻点X0处对f(x)作二阶泰勒展开可得:

    当dxi0的取值很小时,$o\left(\sum\limits_{i=1}^{n}\left(\mathrm{d} x_{i}^{0}\right)^{2}\right)$是二次型$\mathrm{d} \boldsymbol{X}^{0} \boldsymbol{H}_{n}\left(\mathrm{d} \boldsymbol{X}^{0}\right)^{T}$的高阶无穷小,则Δf$\mathrm{d} \boldsymbol{X}^{0} \boldsymbol{H}_{n}\left(\mathrm{d} \boldsymbol{X}^{0}\right)^{\mathrm{T}}$同号.若此时Hn正定,则Hn的特征值均大于0,所有$\mathrm{d} \boldsymbol{X}^{0} \boldsymbol{H}_{n}\left(\mathrm{d} \boldsymbol{X}^{0}\right)^{\mathrm{T}}>0$,Δf(x)>0,f(X0)取极小值,X0为极小值点;若此时Hn负定,则Hn特征值均小于0,所有$\mathrm{d} \boldsymbol{X}^{0} \boldsymbol{H}_{n}\left(\mathrm{d} \boldsymbol{X}^{0}\right)^{\mathrm{T}} < 0$,Δf(x) < 0,f(X0)取极大值,X0为极大值点;若此时Hn的特征值或正或负,则$\mathrm{d} \boldsymbol{X}^{0} \boldsymbol{H}_{n}\left(\mathrm{d} \boldsymbol{X}^{0}\right)^{\mathrm{T}}$也或正或负,Δf(x)也或正或负,X0为鞍点.除此之外的情况需另行讨论驻点X0的状态.

    下面采用降维思想[5],将等式约束条件极值问题用拉格朗日乘数法来求解.只是这时自变量及其增量均受等式约束限制,因而判别极值的矩阵Hn-m*Hn有所不同.现设$m \in \mathbb{N}^{+}$m < n,等式约束有m个:

    作拉格朗日函数:

    在驻点及其某一邻域内满足条件雅克比矩阵满秩(式(12)),并且满足式(13)

    由条件极值的必要性条件,解n+m个方程:$\frac{\partial L}{\partial x_{i}}=0, \frac{\partial L}{\partial \lambda_{j}}=g_{j}=0$,可得驻点.可知任一驻点X0=$\left(x_{1}^{0}, \cdots, x_{n}^{0}; \lambda_{1}^{0}, \cdots, \lambda_{m}^{0}\right)$显然满足m个等式约束(10),即gj(x)=0;且该驻点处的微小改变量(x10+dx10,…,xn0+dxn0)也必须满足这m个等式约束(10),即gj(x10+dx10,…,xn0+dxn0)=Δgj=0,则有ΔL=L(x10+dx10,…,xn0+dxn0λ10+dλ10,…,λm0+dλm0)-L(x10,…,xn0λ10,…,λm0)=$\Delta f+\sum\limits_{j=1}^{m} \lambda_{j} \Delta g_{j}$f.现对L函数(11)在驻点X0处作关于xi0的二阶泰勒展开,此时需将L函数中的λj0看作常量,可得:

    因为在X0处有必要性条件$\frac{\partial L}{\partial x_{i}}=0$,可得:

    对于条件极值和无条件极值充分条件的差别,其关键在于式(9)和式(14)中$\left[\begin{array}{llll}{\mathrm{d} x_{1}^{0}} & {\mathrm{d} x_{2}^{0}} & {\cdots} & {\mathrm{d} x_{n}^{0}}\end{array}\right]$是不同的:式(9)中n个dxi0均为独立变量;式(14)的n个dxi0中,独立变量只有n-m个,而另外m个非独立变量为这n-m个变量的隐函数[1, 6].所以必须找到m个非独立变量与n-m个独立变量间更精确的关系式才能更精确地判别极值点.

    因此约束(10)在满足式(12),(13)的驻点X0处有泰勒级数:

    当dxi0足够小,可令$o(\sqrt{\sum\limits_{i=1}^{n}\left(\mathrm{d} x_{i}^{0}\right)^{2}})=0$,于是解这m个线性方程可得:$\left[\begin{array}{c}{\mathrm{d} x_{1}^{0}} \\ {\mathrm{d} x_{2}^{0}} \\ {\vdots} \\ {\mathrm{d} x_{m}^{0}}\end{array}\right]$=$\left[\begin{array}{cccc}{a_{11}} & {a_{12}} & {\cdots} & {a_{1 n-m}} \\ {a_{21}} & {a_{22}} & {\cdots} & {a_{2 n-m}} \\ {\vdots} & {\vdots} & {\ddots} & {\vdots} \\ {a_{m 1}} & {a_{m 2}} & {\cdots} & {a_{m n-m}}\end{array}\right]\left[\begin{array}{c}{\mathrm{d} x_{m+1}^{0}} \\ {\mathrm{d} x_{m+2}^{0}} \\ {\vdots} \\ {\mathrm{d} x_{m+(n-m)}^{0}}\end{array}\right]$,此时是将$\mathrm{d} x_{m+1}^{0}, \cdots, \mathrm{d} x_{n}^{0}$作为独立变量,其中$\lim\limits _{\mathrm{d} x, \mathrm{d} x_{i}^{0} \rightarrow 0} \frac{\mathrm{d} x}{\mathrm{d} x_{i}^{0}}=c \neq 0$i=1,…,n.记系数矩阵Am×(n-m)为:

    记单位阵In-m为:

    记Hesse变形矩阵Hn-m*为:

    则此时可记

    当dxi0足够小时,$o\left(\sum\limits_{i=1}^{n}\left(\mathrm{d} x_{i}^{0}\right)^{2}\right)$是二次型YHn-m*YT的高阶无穷小,ΔfYHn-m*YT同号.此时若Hn-m*正定,则Hn-m*的特征值均大于0,所有YHn-m*YT>0,Δf(x)>0,f(X0)取极小值,驻点X0为极小值点;若Hn-m*负定,Hn-m*的特征值均小于0,所有YHn-m*YT < 0,Δf(x) < 0,f(X0)取极大值,驻点X0为极大值点;若Hn-m*的特征值或正或负,则YHn-m*YT或正或负,Δf(x)或正或负,驻点X0为鞍点.除此之外的情况需另行讨论驻点X0的状态.

    下面推导系数矩阵Am×(n-m)中元素ajk的表达式以更精确地判别极值.

    n=3,m=2时,有目标函数f(x1x2x3)及约束条件(18),

    设此时雅克比行列式为$J_{\left(x_{1}, x_{2}\right)}=\frac{D\left(g_{1}, g_{2}\right)}{D\left(x_{1}, x_{2}\right)}$,即以x3作为独立变量,此时i=1,2,3,j=1,2,则对等式约束(18)在驻点处作一阶泰勒展开可得:

    n=4,m=2时,有目标函数f(x1x2x3x4)及约束条件(19),

    此时设雅克比行列式为$J_{\left(x_{1}, x_{2}\right)}=\frac{D\left(g_{1}, g_{2}\right)}{D\left(x_{1}, x_{2}\right)}$,即以x3x4作为独立变量,此时i=1,2,3,4,j=1,2,则对等式约束(19)在驻点处作一阶泰勒展开可得:

    继续求解多维多约束的情形,并由数学归纳法可得,$\forall n, m \in \mathbb{N}^{+}$m < nk=1,2,…,n-m,当目标函数为f(x),且f(x)在定义域内对每个xi具有二阶连续偏导数,有等式约束(10),L函数(11)于驻点满足条件(12),(13)时,有式(10)的一阶泰勒级数如下:

    1) 当j=1,即所求系数a1kAm×(n-m)第一行的元素时,

    2) 当j=m,即所求系数amkAm×(n-m)最后一行的元素时,

    3) 当j=2,3,…,m-1,即所求系数ajkAm×(n-m)中间行的元素时,

    现举一例来说明对于等式约束的条件极值采用Hn-m*判别比采用Hn判别更精确.

    例2  对于式(1),(2),取a=1,b=c=-1,此时满足条件a≠0,b≠0,b2+2bc≥0,椭圆方程(1),(2)变为:

    求该椭圆上的点到坐标原点距离的极大值及极小值.

    由前述证明可知该距离必存在一个极大值和一个极小值,现分别采用HnHn-m*判别极值.

     原题等价于求目标函数f=x2+y2+z2在等式约束g1=x-y2-z2=0,g2=x-y-z-1=0下的极大值和极小值.作L函数L=f+λ1g1+λ2g2,于是有:

    采用与上文相同的求解步骤,得L函数的两个驻点:

    此时若采用Hn判别,则有$\boldsymbol{H}_{3}=\left[\begin{array}{ccc}{2} & {0} & {0} \\ {0} & {2-2 \lambda_{1}} & {0} \\ {0} & {0} & {2-2 \lambda_{1}}\end{array}\right]$,当$\lambda_{1}=\lambda_{11}=3+\frac{5}{3} \sqrt{3}$时,2-2λ1 < 0,2>0,则H3不定,(x1y1z1)为f的鞍点;当$\lambda_{1}=\lambda_{21}=3-\frac{5}{3} \sqrt{3}$时,2-2λ1>0,2>0,则H3正定,(x2y2z2)为f的极小值点.但此结果与证明相悖,所以改用Hn-m*判别.因为此时n=3,m=2,点(x1y1z1),(x2y2z2)满足条件:$J_{(x, y)}=\frac{D\left(g_{1}, g_{2}\right)}{D(x, y)}=2 y-1 \neq 0$$\frac{\partial g_{1}}{\partial x}=1 \neq 0, \frac{\partial g_{1}}{\partial y}=-2 y \neq 0, \frac{\partial g_{2}}{\partial x}=1 \neq 0$$\frac{\partial g_{2}}{\partial y}=-1 \neq 0, \operatorname{Rank}\left(J_{(x, y)}\right)=\operatorname{Rank}\left[\begin{array}{cc}{1} & {-2 y} \\ {1} & {-1}\end{array}\right]=2=m$,所以可采用Hn-m*判别极值.由式(17)可得,$\boldsymbol{H}_{3-2}^{*}=\left[\begin{array}{ll}{\boldsymbol{A}_{2 \times(3-2)}^{T}} & {\boldsymbol{I}_{3-2}}\end{array}\right] \boldsymbol{H}_{3}\left[\begin{array}{c}{\boldsymbol{A}_{2 \times(3-2)}} \\ {\boldsymbol{I}_{3-2}}\end{array}\right]$,由式(16)可得$\boldsymbol{A}_{2 \times(3-2)}=\left[\begin{array}{l}{a_{11}} \\ {a_{21}}\end{array}\right]$;当j=1时,由式(20)可得, ${a_{11}} = \frac{(-1)^{1}}{J_{(x, y)}} \cdot \frac{D\left(g_{2}, g_{1}\right)}{D\left(x_{3}, x_{2}\right)}=\frac{2 y-2 z}{2 y-1}=0$ $,当j=2=m时,由式(21)可得,$a_{21}=\frac{(-1)^{2}}{J_{(x, y)}} \cdot \frac{D\left(g_{2}, g_{1}\right)}{D\left(x_{1}, x_{3}\right)}=\frac{-2 z+1}{2 y-1}=$-1;所以此时$\boldsymbol{A}_{2 \times(3-2)}=\left[\begin{array}{c}{0} \\ {-1}\end{array}\right]$$\mathit{\boldsymbol{H}}_{3 - 2}^* = \left[{\begin{array}{*{20}{c}} 0&{ - 1}&1 \end{array}} \right]{\mathit{\boldsymbol{H}}_3}\left[{\begin{array}{*{20}{c}} 0\\ { - 1}\\ 1 \end{array}} \right] = 4\left({1 - {\lambda _1}} \right)$.当$\lambda_{1}=\lambda_{11}=3+\frac{5}{3} \sqrt{3}$时,4(1-λ1) < 0,则H3-2*负定,此时Δf=dz·4(1-λ1)·dz+ο(dx2+dy2+dz2) < 0,(x1y1z1)为f的极大值点,椭圆上的点到原点距离的极大值$\mathrm{d}_{\max }=\sqrt{f_{\max }}=4.63$;当$\lambda_{1}=\lambda_{21}=3-\frac{5}{3} \sqrt{3}$时,4(1-λ1)>0,则H3-2*正定,此时Δf>0,(x2y2z2)为f的极小值点,距离的极小值$\mathrm{d}_{\min }=\sqrt{f_{\min }}=0.78$.所以存在一个极大值和一个极小值,与前述证明相符.

  • 但采用Hn-m*并不能将所有等式约束条件极值的驻点状态准确判别,现再举一例.

    例3 设有椭圆方程:

    求该椭圆上点到原点距离的极大极小值.

     该问题同样可用前文所述初等方法证明极大极小值的存在.现继续采用Hn-m*判别极值.此时该问题等价为求目标函数f=x2+y2+z2在等式约束$g_{1}=\frac{x+3}{2}-y^{2}-z^{2}=0$g2=x-y-z=0下的极大值和极小值.作L函数L=f+λ1g1+λ2g2,有:

    解得L函数的两个驻点为:

    此时有$J_{(x, y)}=2 y-\frac{1}{2} \neq 0, \frac{\partial g_{1}}{\partial x}=\frac{1}{2} \neq 0$$\frac{\partial g_{1}}{\partial y}=-2 y \neq 0, \frac{\partial g_{2}}{\partial x}=1 \neq 0$$ \frac{\partial g_{2}}{\partial y}=-1 \neq 0 $,Rank(J(xy))=$\operatorname{Rank}\left[\begin{array}{cc}{\frac{1}{2}} & {-2 y} \\ {1} & {-1}\end{array}\right]=2=m$,所以可采用Hn-m*判别极值.当j=1时,由式(20)可得, ${a_{11}} = \frac{{{{(- 1)}^1}}}{{{J_{(x, y)}}}} \cdot \frac{{D\left({{g_2}, {g_1}} \right)}}{{D\left({{x_3}, {x_2}} \right)}} = \frac{{2y - 2z}}{{ - 2y + \frac{1}{2}}} = 0 $,当j=2=m时,由式(21)可得,$a_{21}=\frac{(-1)^{2}}{J_{(x, y)}} \cdot \frac{D\left(g_{2}, g_{1}\right)}{D\left(x_{1}, x_{3}\right)}=\frac{-2 z+\frac{1}{2}}{2 y-\frac{1}{2}}=-1$;所以此时$\boldsymbol{A}_{2 \times(3-2)}=\left[\begin{array}{c}{0} \\ {-1}\end{array}\right]$$\boldsymbol{H}_{\dot{3}-2}^{*}=\left[\begin{array}{lll}{0} & {-1} & {1}\end{array}\right] \boldsymbol{H}_{3}\left[\begin{array}{c}{0} \\ {-1} \\ {1}\end{array}\right]=4\left(1-\lambda_{1}\right)$.当$ \lambda_{1}=\lambda_{11}=3+\frac{3}{13} / 13 $时,4(1-λ1) < 0,则H3-2*负定,此时Δf < 0,(x1y1z1)为f的极大值点;当$\lambda_{1}=\lambda_{21}=3-\frac{3}{13} \sqrt{13}$时,4(1-λ1) < 0,则H3-2*负定,此时Δf < 0,(x2y2z2)也为f的极大值点,与实际情况矛盾,此时使用Hn-m*判定失效.出现这种情况的原因在于式(15)为寻找自变量增量间的解析表达式,对约束条件在驻点处作的一阶泰勒展开,省略了二阶及其以上的高阶无穷小量,因而不是自变量增量间最精确的关系式[7-8].随着目标函数维数增加,等式约束数目及复杂程度增大,即使只作一阶泰勒展开,求解式(15)中非独立变量关于独立变量的解析表达式已相当复杂,如果将泰勒级数展开到二阶或者更高阶,将更难甚至无法求解出表达式.尽管如此,采用Hn-m*判别等式约束的条件极值确实比采用Hn更精确,因为用一阶泰勒展开求解了自变量增量间的关系式.

  • 采用Hesse矩阵Hn判别无条件极值的充分条件是准确的,而判别存在等式约束的条件极值的充分条件不够精确;采用本文提出的Hesse变形矩阵Hn-m*判别后者更精确,因其可判别出一部分被Hn错误判定的驻点.产生这种差别的原因是无条件极值问题的自变量微小增量dxi间没有约束关系,即所有dxi均是独立变量;而条件极值问题的自变量微小增量dxim个等式约束有关,n个dxi中只有n-m个是独立变量,另外m个非独立变量是这n-m个变量的隐函数.

    由于对等式约束在驻点处作一阶泰勒展开得到的关系式(15)是在舍弃了二阶及其以上的高阶无穷小量时得到的,即本文得出的非独立变量与独立变量间的关系式并不是最准确的,所以Hn-m*仍不能将所有驻点的状态均准确判定.若将式(15)式作更高阶的泰勒展开,则可得到更精确的Hn-m*,从而正确判别出更多驻点的状态;但其解析表达式过于复杂不便推导及表述,寻找系数矩阵Am×(n-m)的数值解是更有实际意义的.

参考文献 (8)

目录

/

返回文章
返回