-
条件极值问题是分析学和运筹学当中的重要内容, 它主要是对一定约束条件下目标函数的求解, 例如求解满足约束条件gi(x1, x2, …, xn)=0 (i=1, 2, …, k)的目标函数z=f(x1, x2, …, xn).这里f, gi都是二阶连续可微的函数, 1≤k<n.我们记向量值函数g=(g1, g2, …, gk)T, 梯度算子D=
$\left({\frac{\partial }{{\partial {x_1}}}, \cdots, \frac{\partial }{{\partial {x_n}}}} \right)$ .当Dg行满秩时, 约束条件g=0确定了一个隐函数组y=y(x).不妨设该隐函数组的自变量和因变量分别为x=(x1, x2, …, xm), y=(xm+1, xm+2, …, xn), 自然数m=n-k.于是原条件极值问题可记为我们知道z=f(x, y)的无约束极值可根据Hessian矩阵Hf=
${\left({\frac{{{\partial ^2}f}}{{\partial {x_i}\partial {x_j}}}} \right)_{n \times n}}$ 来进行判断[1].然而条件极值问题(1)却没有完整的判定定理.因为当拉格朗日函数关于P(x, y)的Hessian矩阵HL不定时, 无法确定f的极值情况.文献[2]给出了相应的反例:
此时HL在驻点(x1, x2, x3, λ)=(0, 0, 0, 0)处是不定的, 然而上述问题的f却在点P(x1, x2, x3)=(0, 0, 0)处取得极小值.这说明了条件极值问题在求解与判定方面都更加复杂和困难.约束极值的研究价值不仅限于多元函数, 它在泛函的临界点理论中也有着重要的应用, 具体案例参见文献[3-5].本文将结合驻点的一阶可行变分空间, 研究条件极值的二阶判定方法.
记可行集
$\mathscr{M}$ ={(x, y):g(x, y)=0}.假设点P0(x, y)∈$\mathscr{M}$ 是f在$\mathscr{M}$ 上的极值点, 则存在拉格朗日乘子λ=(λ1, λ2, …, λk), 使得记增量Δx=(Δx1, …, Δxm), Δy=(Δxm+1, …, Δxn).若点P(x+Δx, y+Δy)∈
$\mathscr{M}$ , 则利用泰勒展开式可知:其中1≤i≤k.将(4)式乘以相应的λi, 再累加到(3)式上, 结合(2)式可得
由(5)式可以看出, 仅凭借HL (P0)在
${{\mathbb{R}}^{n}}$ 上的正定(负定)性来判断极值是十分粗略的, 有些情形下甚至是失效的.这是因为点P在可行集上变动时, 对应的增量(Δx, Δy)仅是${{\mathbb{R}}^{n}}$ 的一个子集.我们记$\mathscr{M}$ 上点P0的一阶可行变分子空间为进而得到如下结论.
定理1 设函数f, gi(i=1, …, k)均在点P0∈
${{\mathbb{R}}^{n}}$ 的某邻域内二阶连续可微, 且矩阵Dg的秩为k.若点(P0, λ)是拉格朗日函数L(P, λ)=f(P)+$\sum\limits_i {{\lambda _i}{g_i}\left( P \right)} $ 的驻点, 则:(a) 当HL (P0)在空间V(P0)上正定时, 函数f在点P0取条件极小值;
(b) 当HL (P0)在空间V(P0)上负定时, 函数f在点P0取条件极大值;
(c) 当HL (P0)在空间V(P0)上不定时, 函数f在点P0一定不取极值.
注 文献[6-7]提出了结论(a), (b)的一种证明方法.但是文献[6-7]中的方法较为繁琐, 不易推广, 无法解决HL (P0)不定时的判定.于是本文建立了一个新的估计式, 它既给出了结论(a), (b)的简洁证明, 同时得到更丰富的结果.
我们记多元函数的偏微分算子:
则向量值函数g的偏微分记为:
一般情况下, 点P在P0的邻域N(P0)∩
$\mathscr{M}$ 内变动时, 自变量的增量(Δx, Δy)与(δx, δy)∈V(P0)是不同的两个量.我们需要先建立估计式, 找到集合$\mathscr{M}$ 与空间V(P0)的联系.命题1 任何(δx, δy)∈V(P0)和实数t, 当Δx=tδx时, 增量Δy=y(x+tδx)-y(x)满足Δy=tδy+o(t)·I1×n, 其中I1×n是1×n阶的全1矩阵.
证 对g (x, y)=0两端关于x求偏微分, 得
于是
由(δx, δy)∈V(P0)知
于是
利用多元函数的泰勒展开式得:
其中ξi是x与x+tδx之间的中值点, i=1, …, k.证毕.
定理1的证明
(a) 已知HL (P0)在空间V(P0)上正定.于是在驻点P0(x, y)的ε-邻域Nε(P0)内任取一点P(x+Δx, y+Δy)∈
$\mathscr{M}$ , 令:可知
记
显然当ε→0时, ‖Δx‖和t都收敛到0.令:
运用(5)式与命题1可得
因为二次型Q(δx, δy)在单位闭球上一定能取到最小值, 所以存在正数Qm>0, 使得Q(δx, δy)≥Qm>0.注意到(6)式中o(t2)关于ε的一致性.我们推出:只要ε充分小, 则任何P∈Nε(P0)都满足
即f在P0取到极小值.
(b) 证明与(a)同理.
(c) 已知HL(P0)在空间V(P0)上不定, 则存在两个线性无关的向量(δx+, δy+), (δx-, δy-)∈V(P0), 使得
对任意的t>0, 记:
则增量Δx=tδx+, Δy=y(x+tδx+)-y(x).取点Pt(xt, yt)∈
$\mathscr{M}$ , 利用命题1知, 当t充分小时, 有因此在点P0的任何邻域内都存在点Pt∈
$\mathscr{M}$ , 使得f(Pt)>f(P0).同理利用Q(δx-, δy-)<0可知, 存在点P′t∈$\mathscr{M}$ , 使得f(P′t)<f(P0).综上所述, 函数f在点P0一定不取条件极值.
The Lagrangian Method to a Class of Conditional Extremum Problems
-
摘要: 研究了多元函数条件极值的充分条件与判定方法,建立了可行集$\mathscr{M}$与变分空间V(P0)上的点之间的联系.利用二者间关键的误差估计,给出了条件极值判定定理的简化证明.Abstract: In this paper, the sufficient conditions and determination method of the conditional extremum of multivariate functions are studies, and a connection is established between the points on the feasible set $\mathscr{M}$ and the variational set V(P0). By a critical error estimate of the two sets, the proof of the conditional extremum theorem is remarkably simplified.
-
Key words:
- conditional extremum /
- Lagrange multiplier method /
- sufficient condition .
-
-
[1] 华东师范大学数学系.数学分析[M]. 4版.北京:高等教育出版社, 2010. [2] 张筑生.数学分析新讲[M].北京:北京大学出版社, 1990. [3] doi: https://link.springer.com/article/10.1007/s00526-013-0694-5 HU K, TANG C L. Existence of Positive Solutions of Shroinger Equations with Potentials in Nonlinearity[J].西南大学学报(自然科学版), 2010, 32(6): 129-134. [4] 刘磊, 吴行平, 唐春雷.一类带临界指数的半线性椭圆方程多重变号解的存在性[J].西南师范大学学报(自然科学版), 2013, 38(5): 5-9. doi: http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=xnsfdxxb201305002 [5] 吕颖, 唐春雷.一类次二次二阶Hamilton系统的同宿轨[J].西南大学学报(自然科学版), 2013, 35(4): 84-87. doi: http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=xnnydxxb201304016 [6] AVRIEL M. Nonlinear Programming: Analysis and Methods[M]. New Jersey: Prentice-Hall, 1976. [7] BERTSEKAS D P. Nonlinear Programming[M]. 2th ed. New Hampshire: Athena Scientific, 1999. -
计量
- 文章访问数: 1061
- HTML全文浏览数: 737
- PDF下载数: 153
- 施引文献: 0