一种具有充分下降性的新混合型共轭梯度法

郑宗剑; 韩信

doi:10.13718/j.cnki.xsxb.2022.01.001

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名

姓名不能为空！

邮箱

邮箱不能为空！非法的邮箱地址。

手机号码

电话不能为空！

请输入有效手机号!

标题

标题不能为空！

留言内容

内容不能为空！

验证码

验证码不能为空！

验证码错误！

一种具有充分下降性的新混合型共轭梯度法

1.
四川文理学院数学学院, 四川达州 635000

2.
西南大学电子信息工程学院, 重庆 400715

基金项目: 国家自然科学基金项目(11701470);四川文理学院2019年度校级科研项目学科专业群发展研究专项重点资助项目(2019XKQ001); 四川文理学院2017年度科研基金自然科学研究一般项目(2017KZ010Y)

详细信息

作者简介:
郑宗剑, 副教授, 主要从事最优化理论与算法、动力系统分支理论与应用研究 .

通讯作者: 韩信, 助教

中图分类号: O224

A New Hybrid Conjugate Gradient Method with Sufficient Descent Property

1.
School of Mathematics, Sichuan University of Arts and Science, Dazhou Sichuan 635000, China

2.
College of Electronic and Information Engineering, Southwest University, Chongqing 400715, China

摘要: 对PRP法和FR法进行凸组合, 提出了一种求解无约束优化问题的新共轭梯度法.该方法总是能生成一个充分下降方向, 且它的凸组合参数为Babaie-Kafaki和Ghanbari的推广形式.在Wolfe线搜索条件下, 新算法的全局收敛性得以建立, 数值结果也说明提出的算法是有效的.

Abstract: In this paper, a new hybrid conjugate gradient algorithm has been developed for solving unconstrained optimization problems. The proposed method can be viewed as a convex combination of Polak-Ribière-Polyak method and Fletcher-Reeves method. In this method, a sufficient descent direction can always be generated, with its convex combination parameter as an extension of the parameter proposed by Babaie-Kafaki and Ghanbari. Under the Wolfe line search, the global convergence has been established. Some numerical results show that proposed method is effective.

Key words:

函数名

维度/维

算法

迭代次数/次

迭代时间/s

梯度值

LIARWHD

NH+

138

2 137.390

9.37E-07

PRP+

1 303.897

9.93E-07

NYF

345

11 117.170

9.02E-06

HCG+

340

3 605.104

1.10E-05

DIAGONAL

NH+

179

1 957.943

8.47E-07

PRP+

132

1 292.290

7.51E-07

NYF

708

2 381.197

8.95E-07

HCG+

740

3 615.365

1.04E-05

QUADRATICQF1

100

NH+

181

2 089.250

0.00E+00

100

PRP+

136

1 315.878

0.00E+00

100

NYF

231

4 130.011

1.15E-02

100

HCG+

282

3 613.380

9.89E-03

QUARTC

400

NH+

1 859.335

9.91E-07

400

PRP+

3 633.389

4.55E-03

400

NYF

3 643.121

3.70E-03

400

HCG+

1 956.870

9.91E-07

一种具有充分下降性的新混合型共轭梯度法

通讯作者: 韩信, 助教

作者简介: 郑宗剑, 副教授, 主要从事最优化理论与算法、动力系统分支理论与应用研究
1. 四川文理学院数学学院, 四川达州 635000

2. 西南大学电子信息工程学院, 重庆 400715

收稿日期: 2020-03-08

关键词:

A New Hybrid Conjugate Gradient Method with Sufficient Descent Property

Corresponding author: HAN Xin

1. 四川文理学院数学学院, 四川达州 635000

2. 西南大学电子信息工程学院, 重庆 400715

Received Date: 2020-03-08

Keywords:

全文HTML

本文考虑下面的无约束优化问题：

这里f：${\mathbb{R}^n} \to \mathbb{R}$是一个光滑函数，$\mathbb{R}^n$表示n维欧氏空间，函数f的梯度记为g(x)：=▽f(x). 在实际求解大规模无约束优化问题中，建立一些具有低存储的快速数值算法是十分重要的. 共轭梯度法是求解大型无约束优化问题(1)的一类十分有效的方法^[1]，其通常的迭代形式如下

这里x_k∈ $\mathbb{R}^n$是一个解的第k次逼近，α_k > 0是由一种合适的线搜索所确定的步长，d_k∈ $\mathbb{R}^n$是搜索方向，其定义如下

其中：g_k表示梯度g(x_k)，β_k∈ $\mathbb{R}$为共轭参数. 步长α_k由标准的Wolfe线搜索

或者强Wolfe线搜索

确定，其中0 < δ < σ < 1. 不同的共轭梯度法对应不同的共轭参数β_k. 众所周知的共轭梯度法包括Hestenes-Stiefel(HS)^[2]，Polak-Ribière-Polyak(PRP)^[3-4]，Dai-Yuan(DY)^[5]，Liu-Storey(LS)^[6]，Fletcher-Reeves(FR)^[7]和Conjugate-Descent(CD)^[8]，它们所对应的共轭参数如下

其中y_k－1：=g_k－g_k－1且||·||表示欧氏范数. 目标函数是一个严格凸二次函数并且步长由精确线搜索得到，且在一般情形下，它们的理论性质和数值表现不尽相同. 众所周知，DY法、CD法和FR法具有良好的收敛性质，但它们的数值计算效果一般；相反，PRP法、HS法和LS法具备出色的数值表现，但它们可能不收敛. 为了获得收敛性数值效果的算法，不少学者对共轭参数自身作了一些改进^[9-10]和一些混合^[11-12]. 本文主要考虑共轭梯度法的混合形式. 文献[13]通过对PRP法和DY法进行凸组合，得到一种新的共轭梯度法，其共轭参数如下

其中参数θ_k∈[0, 1]由共轭条件$\boldsymbol{y}_{k-1}^{\mathrm{T}} \boldsymbol{d}_{k}=0$确定. 最近，文献[14]对PRP法和FR法进行凸组合，引进了一种混合共轭梯度法：

这里参数θ_k∈[0, 1]根据求解优化问题$\mathop {\min }\limits_{_{{\theta _k}}}\left\{\left\|\boldsymbol{d}_{k}^{H C G}-\boldsymbol{d}_{k}^{Z Z L}\right\|^{2}: k \geqslant 1\right\}$得到. 在标准的Wolfe线搜索条件下，该算法具有全局收敛性和良好的计算表现.

受文献[14]的启发，本文构造了一种新的混合共轭梯度法

这里

其中

为优化问题$\mathop {\min }\limits_{_{{\theta _k}}}\left\{\left\|\boldsymbol{d}_{k}^{\mathrm{NH}+}-\boldsymbol{d}_{k}^{\mathrm{NYF}}\right\|^{2}: k \geqslant 1\right\}$的最优解. 基于共轭参数β_k^NH+所得相应的共轭梯度法称作NH+算法或NH+法. 因为文献[15]提出的ZZL法是文献[16]提出的NYF法特殊情况. 因此，文献[14]提出的方法是NH+法的特殊情况(当p_k=g_k即为文献[14]中的方法).

1. NH+型共轭梯度算法

基于共轭参数β_k^NH+的计算公式(5)，所得的NH+算法如下：

NH+算法

步骤1：给定初始点x₁和精度ε. 置k=1，令d₁=－g₁.

步骤2：若||g_k||≤ε，终止. 否则，转步骤3.

步骤3：通过(3)式计算搜索方向d_k.

步骤4：由标准的Wolfe线搜索(4)确定步长因子α_k.

步骤5：由(2)式计算下一个迭代点x_k+1.

步骤6：令k：=k+1，转步骤2.

2. 算法NH+的全局收敛性分析

为了论证算法NH+的收敛性，给出了如下的基本假设.

假设1    水平集S={x：f(x)≤f(x₀)}有界，即存在$\tilde a$ > 0，对于任意x∈S，有‖x‖≤ $\tilde a$.

目标函数的梯度函数在S的某邻域U内Lipschitz连续，即存在常数L > 0，对任意x，y∈U，有‖g(x)－g(y)‖≤L‖x－y‖.

由假设可知存在常数γ > 0，对任意x∈S，有

以Zoutendijk条件为基础给出如下引理1. 这个引理在论证共轭梯度算法的全局收敛性过程中具有重要的作用.

引理1    假设1成立，算法NH+的搜索方向是下降的，步长满足标准Wolfe线搜索条件，则Zoutendijk条件即$\sum_{k=0}^{\infty} \frac{\left(\boldsymbol{g}_{k}^{\mathrm{T}} \boldsymbol{d}_{k}\right)^{2}}{\left\|\boldsymbol{d}_{k}\right\|^{2}}<\infty$成立.

证    由标准Wolfe线搜索条件(4)，知

另一方面，由假设1和(2)式，有

再结合算法NH+的下降性，得

进一步由(4)式知

对(7)式从k=1，2，…，∞求和，并注意目标函数f(x)有下界，即知Zoutendijk条件成立. 因此，结论得证.

下面的引理是论证算法NH+全局收敛性的关键. 这个引理的具体论证过程可参见文献[17].

引理2^[17]   假设1、充分下降性、标准Wolfe线搜索条件均成立. 若$\sum_{k=0}^{\infty} \frac{1}{\left\|\boldsymbol{d}_{k}\right\|^{2}}=\infty$，则$\mathop {\lim \inf }\limits_{k \to \infty } \left\|\mathit{\boldsymbol{g}}_{k}\right\|=0$.

注    通常利用的是引理2的逆否命题，即若$\mathop {\lim \inf }\limits_{k \to \infty }\left\|\mathit{\boldsymbol{g}}_{k}\right\| \neq 0$，则$\sum_{k=0}^{\infty} \frac{1}{\left\|\boldsymbol{d}_{k}\right\|^{2}}<\infty$. 对于共轭梯度算法，文献[18]给出了性质(*)，当s_k：=x_k+1－x_k变小时，β_k也将变小.

性质(*)^[18]    对于共轭梯度算法，若任意k≥0，都有0 < γ ≤ ‖g_k‖. 而且，若常数b > 1，λ > 0，使得|β_k|≤b和$\left\|\mathit{\boldsymbol{s}}_{k}\right\| \leqslant \lambda \Rightarrow\left|\beta_{k}\right| \leqslant \frac{1}{2 b}$都成立，就称算法具有性质(*).

接下来，假设全局收敛性不在有限步发生.

引理3    若假设1、充分下降性、标准Wolfe线搜索条件均成立. 如果性质(*)成立，则d_k≠0且$\sum_{k=1}^{\infty}\left\|\boldsymbol{u}_{k}-\boldsymbol{u}_{k-1}\right\|^{2}<\infty$，其中$\boldsymbol{u}_{k}:=\frac{\boldsymbol{d}_{k}}{\left\|\boldsymbol{d}_{k}\right\|}$.

证    由d_k≠0，g_k≠0及充分下降性知，u_k的定义有意义.

现定义$\boldsymbol{\rho}_{k}:=\frac{-\boldsymbol{g}_{k}}{\left\|\boldsymbol{d}_{k}\right\|}$和以下式子

由(3)式和(5)式，对任意k≥1，有

基于‖u_k‖=‖u_k－1‖=1和(9)式，得

由于β_k^NH+≥0，则(8)式中的ω_k≥0. 此外，利用三角不等性和(10)式，可得

由Zoutendijk条件、充分下降条件和(8)式知

利用性质(*)、(11)式和(12)式，有$\sum_{k=1}^{\infty}\left\|\boldsymbol{u}_{k}-\boldsymbol{u}_{k-1}\right\|^{2} \leqslant 4 \sum_{k=1}^{\infty}\left\|\boldsymbol{\rho}_{k}\right\|^{2}<\infty$，结论得证.

现令${\mathbb{N}_ + }$为非零自然数集. 给定正常数λ和正整数Δ，定义

其中|K_k，Δ^λ|表示K_k，Δ^λ的元素个数.

引理4    若引理3的所有假设条件都成立. 算法NH+满足性质(*)，则存在常数λ和k₀，对任意Δ∈ ${\mathbb{N}_ + }$和$\tilde k$≥k₀，使得

证    利用反证法论证. 假设存在Δ∈ ${\mathbb{N}_ + }$和常数k₀，对任意正常数λ和任意k≥k₀，有

b > 1和η > 0是性质(*)中的常数. 令λ=η，由性质(*)和(13)式，有

因此

对任意i≥1，k₀≤l≤k₀+iΔ，存在i′，使得

再由b > 1和(14)式得

其中c₁=(2b²)^Δ+1.

通过性质(*)、(6)式、(15)式和(16)式，有

其中c₂=‖d_k₀‖. 所以，$\sum_{k=0}^{\infty} \frac{1}{\left\|\boldsymbol{d}_{k}\right\|^{2}} \geqslant \sum_{i=1}^{\infty} \frac{1}{\left\|\boldsymbol{d}_{k_{0}+i \mathit{\Delta}}\right\|^{2}} \geqslant \sum_{i=1}^{\infty} \frac{1}{2 \overline{\gamma^{2}}+2 b^{2} c_{1}(i \mathit{\Delta}-1)+c_{2}}=\infty$.

由引理2知$\mathop {\lim \inf}\limits_{k \to \infty } \left\|\mathit{\boldsymbol{g}}_{k}\right\|=0$，这与假设矛盾. 因此，原结论成立.

结合引理3和4，利用文献[14]的论证方法易得下面的定理1. 限于篇幅，这里略去证明过程.

定理1    若假设1和标准Wolfe线搜索都成立. 如果算法NH+满足下面3个性质：

(p1) 对任意k≥1，有β_k^NH+≥0；

(p2) 充分下降性和Zoutendijk条件均满足；

(p3) 性质(*)成立，而且存在正常数M，使得θ_k≤M‖s_k－1‖.

则算法NH+全局收敛.

[1]	唐天国. 一种求解无约束优化问题的新混合共轭梯度法[J]. 西南师范大学学报(自然科学版), 2019, 44(9): 34-39. doi: http://xbgjxt.swu.edu.cn/article/doi/10.13718/j.cnki.xsxb.2019.09.006
[2]	HESTENES M R, STIEFEL E. Methods of Conjugate Gradients for Solving Linear Systems[J]. Journal of Research of the National Bureau of Standards, 1952, 49(6): 409-436. doi: 10.6028/jres.049.044
[3]	POLAK E, RIBIERE G. Note Sur La Convergence de Méthodes de Directions Conjuguées[J]. Revue Française d'Informatique et De Recherche Opérationnelle Série Rouge, 1969, 3(16): 35-43.
[4]	POLYAK B T. The Conjugate Gradient Method in Extremal Problems[J]. USSR Computational Mathematics and Mathematical Physics, 1969, 9(4): 94-112. doi: 10.1016/0041-5553(69)90035-4
[5]	DAI Y H, YUAN Y. A Nonlinear Conjugate Gradient Method with a Strong Global Convergence Property[J]. SIAM Journal on Optimization, 1999, 10(1): 177-182. doi: 10.1137/S1052623497318992
[6]	LIU Y, STOREY C. Efficient Generalized Conjugate Gradient Algorithms, Part 1: Theory[J]. Journal of Optimization Theory and Applications, 1991, 69(1): 129-137. doi: 10.1007/BF00940464
[7]	FLETCHER R, REEVES C M. Function Minimization by Conjugate Gradients[J]. The Computer Journal, 1964, 7(2): 149-154. doi: 10.1093/comjnl/7.2.149
[8]	FLETCHER R. Practical Method of Optimization, Unconstrained Optimization[M]. New York: John Wiley and Sons, 1987.
[9]	SHENGWEI Y, WEI Z X, HUANG H. A Note about WYL's Conjugate Gradient Method and Its Applications[J]. Applied Mathematics and Computation, 2007, 191(2): 381-388. doi: 10.1016/j.amc.2007.02.094
[10]	DAI Z F, WEN F H. Another Improved Wei-Yao-Liu Nonlinear Conjugate Gradient Method with Sufficient Descent Property[J]. Applied Mathematics and Computation, 2012, 218(14): 7421-7430. doi: 10.1016/j.amc.2011.12.091
[11]	韩信, 张俊容, 王森森. 一种新的混合共轭梯度算法[J]. 西南大学学报(自然科学版), 2017, 39(5): 132-138. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-XNND201705020.htm
[12]	LIU J K, DU X L. Global Convergence of an Efficient Hybrid Conjugate Gradient Method for Unconstrained Optimization [J]. Bulletin of the Korean Mathematical Society, 2013, 50(1): 73-81. doi: 10.4134/BKMS.2013.50.1.073
[13]	ANDREI N. Hybrid Conjugate Gradient Algorithm for Unconstrained Optimization[J]. Journal of Optimization Theory and Applications, 2009, 141(2): 249-264. doi: 10.1007/s10957-008-9505-0
[14]	BABAIE-KAFAKI S, GHANBARI R. A Hybridization of the Polak-Ribière-Polyak and Fletcher-Reeves Conjugate Gradient Methods[J]. Numerical Algorithms, 2015, 68(3): 481-495. doi: 10.1007/s11075-014-9856-6
[15]	ZHANG L, ZHOU W J, LI D H. A Descent Modified Polak-Ribière-Polyak Conjugate Gradient Method and Its Global Convergence[J]. IMA Journal of Numerical Analysis, 2006, 26(4): 629-640. doi: 10.1093/imanum/drl016
[16]	NARUSHIMA Y, YABE H, FORD J A. A Three-Term Conjugate Gradient Method with Sufficient Descent Property for Unconstrained Optimization[J]. SIAM Journal on Optimization, 2011, 21(1): 212-230. doi: 10.1137/080743573
[17]	ZOUTENDIJK G. Nonlinear Programming, Computational Methods[J]. Integer and Nonlinear Programming, 1970, 143: 37-86.
[18]	GILBERT J C, NOCEDAL J. Global Convergence Properties of Conjugate Gradient Methods for Optimization[J]. SIAM Journal on Optimization, 1992, 2(1): 21-42. doi: 10.1137/0802003
[19]	ANDREI N. An Unconstrained Optimization Test Functions Collection[J]. Environmental Science and Technology, 2008, 10(1): 6552-6558.
[20]	DOLAN E D, MORÉ J J. Benchmarking Optimization Software with Performance Profiles[J]. Mathematical Programming, 2002, 91(2): 201-213. doi: 10.1007/s101070100263

留言板