Wolfe线搜索下充分下降性的FR型共轭梯度法

王开荣; 徐晓光

doi:10.13718/j.cnki.xdzk.2017.07.014

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名

姓名不能为空！

邮箱

邮箱不能为空！非法的邮箱地址。

手机号码

电话不能为空！

请输入有效手机号!

标题

标题不能为空！

留言内容

内容不能为空！

验证码

验证码不能为空！

验证码错误！

Wolfe线搜索下充分下降性的FR型共轭梯度法

重庆大学数学与统计学院，重庆 401331

基金项目: 国家自然科学基金项目(11571055)；重庆市研究生教育教学改革研究项目(yjg143046)

详细信息

作者简介:
王开荣(1965-)，男，重庆垫江人，教授，主要从事最优化理、算法论和应用方面的研究 .

中图分类号: O221.2

A Sufficient Descent FR Type Conjugate Gradient Method Under the Wolfe Line Search

College of Mathematics and Statistics, Chongqing University, Chongqing 401331, China

摘要: 在FR共轭梯度法的基础之上，提出了一种新的共轭梯度法.在标准的Wolfe线搜索下，证明了该算法的充分下降性和收敛性.最后，给出初步的数值实验结果并表明该方法是有效的.

Abstract: In this paper, based on the FR conjugate gradient method, a new conjugate gradient method is proposed. Under the standard Wolfe line search, the sufficient descent property and the global convergence are proved. Finally, preliminary numerical results are reported, which show that the proposed method is valid.

Key words:

测试函数

Dim/
维

FR/次

MFR/次

XMFR/次

Almost Perturbed Quadratic

200

215

430

1 078

215

430

1 078

170

340

853

ARWHEAD

100

150

378

150

378

156

393

Diagonal 1

213

208

Diagonal 2

200

162

408

120

240

603

178

448

Diagonal 3

128

323

128

323

126

318

Diagonal 4

100

156

312

783

156

312

783

101

202

508

Diagonal 4

200

148

296

743

148

296

743

101

202

508

Diagonal 4

1000

157

314

788

157

314

788

103

206

518

Diagonal 7

100

163

Diagonal 8

100

173

DQDRTRIC

100

186

372

933

186

372

933

180

453

FULL Hessian FH2

1118

2 236

5 593

1 103

2 206

5 518

968

1936

4843

Hager

100

158

183

HIMMELBG

100

LIARWHD

100

171

342

858

171

342

858

181

362

908

NONDIA

100

280

560

1 403

280

560

1 403

229

458

1148

Quadratic QF1

100

148

296

743

148

296

743

115

230

578

QUARTC

100

Raydan 1

100

Raydan 1

300

186

468

186

468

186

468

Raydan 2

100

Raydan 2

300

Wolfe线搜索下充分下降性的FR型共轭梯度法

作者简介: 王开荣(1965-)，男，重庆垫江人，教授，主要从事最优化理、算法论和应用方面的研究
重庆大学数学与统计学院，重庆 401331

收稿日期: 2016-10-04

基金项目: 国家自然科学基金项目(11571055)；重庆市研究生教育教学改革研究项目(yjg143046)

关键词:

全文HTML

考虑如下无约束最优化问题

其中：x为决策变量，目标函数f： ${{\mathbb{R}}^{n}}\to \mathbb{R}$ 是连续可微函数.共轭梯度法是解决上述无约束优化问题的常用方法.由于其迭代简单，储存量低，所以常用于解决大规模优化问题.其基本迭代格式为

其中：α_k是步长，d_k是搜索方向. d_k的基本迭代格式为

记g(x_k)=∇f(x_k)，β_k为标量，关于β_k的计算有多种形式，不同的β_k对应着不同的共轭梯度算法.一些著名的β_k公式有：

其中：y_k-1=g_k-g_k-1，‖·‖表示Euclid范数.关于这6种著名的共轭梯度法的详细内容可以参考文献[1-7].

本文主要研究一种FR型共轭梯度方法.众所周知FR方法是求解无约束优化问题最有效的方法之一.文献[8]首先证明了FR方法在精确线搜索下对一般非线性函数是全局收敛的，由于精确线搜索代价比较大，所以在实际的计算中人们通常使用非精确线搜索.例如文献[9]首先给出了在非精确线搜索下的非线性共轭梯度算法的全局收敛性结果，并证明了在强Wolfe线搜索下，当 $\sigma ＜ \frac{1}{2}$ 时FR方法满足充分下降性条件，同时全局收敛.文献[10-11]进一步将上面的收敛结果推广到 $\sigma = \frac{1}{2}$ 的情形.后来许多学者开始对FR方法产生了兴趣，做出了对FR方法的修正以及变形，得到了比较好的结果.例如文献[12]推广了FR方法，得到了一种修正的FR型共轭梯度方法，其中β_k为

本文在文献[12]的基础之上，进一步研究FR型方法，提出了另外一种修正的FR型共轭梯度方法，改进的修正FR型公式记为β_k^XMFR，

其中u＞1.在Wolfe线搜索下证明了其全局收敛性.

在证明算法的全局收敛性时，一般采用Wolfe线搜索来计算步长α_k，即典型的Wolfe非精确线搜索为：

其中δ和σ是满足0＜δ＜σ＜1的常数.

1. 新算法及其充分下降性

算法1

步骤1 初始化.给定初始点 ${{\mathit{\boldsymbol{x}}}_{1}}\in {{\mathbb{R}}^{n}}$ ，u＞1，令d₁=-g₁，k：=1，设 ${{a}_{1}}=\frac{1}{\left\| {{\mathit{\boldsymbol{g}}}_{1}} \right\|}$ ，如果‖g₁‖≤ε，则停止.

步骤2 线搜索.计算步长α_k，使得α_k满足Wolfe非精确线搜索(6).

步骤3 令x_k+1=x_k+α_kd_k，g_k+1=g(x_k+1).如果‖g_k+1‖≤ε，则停止.

步骤4 计算d_k，d_k满足(3) 和(5) 式.如果Powell重开始条件

成立，则重新开始，令

计算

步骤5 令k：=k+1，转步骤2.

首先，在无任何线搜索条件下证明由(3) 和(5) 式所确定的方向满足充分下降条件

定理1 考虑(2) 和(3) 式的迭代方法，β_k由(5) 式产生，u＞1，对任意k≥1，总有下式成立

证若g_k^Td_k-1=0，则由g_k与(3) 式两端作内积得：

则(7) 式显然成立.

若g_k^Td_k-1≠0，则有

因此，对所有的k≥1，(7) 式总是成立的.

定理2 对于所有的k≥1，参数β_k^XMFR满足 $0\le \beta _{k}^{\rm{XMFR}}\le \frac{{{\left\| {{\mathit{\boldsymbol{g}}}_{k}} \right\|}^{2}}}{{{\left\| {{\mathit{\boldsymbol{g}}}_{k-1}} \right\|}^{2}}}$ .

证根据β_k^XMFR的定义，有

其中θ_k是g_k和d_k-1的夹角.

另一方面，由于

所以有

因此，结论是成立的.

2. 新算法的全局收敛性

为了获得算法1的全局收敛性，需要下面两个常用的假设：

(H1) 假设目标函数f(x)在水平集E={ $\mathit{\boldsymbol{x}}\in {{\mathbb{R}}^{n}}$ |f(x)≤f(x₁)}上有界，其中x₁为算法初始点.

(H2) 在E的某个邻域N内，目标函数f(x)连续可微且梯度函数g(x)满足Lipschitz条件，即存在常数L＞0，使得

引理1^[13] 设目标函数f(x)满足(H₁)和(H₂)，{x_k}由(2) 和(3) 式产生，d_k满足下降方向，α_k满足Wolfe线搜索，则有

根据(7) 式可得

假设(H1)，(H2) 成立，迭代序列{x_k}由(2) 和(3) 式产生，{g_k}为算法产生的序列，则有

证利用反证法来证，假设结论不成立，则存在常数γ＞0，使得

对(3) 式两端取模平方得：

由于

可得

从而有

(9) 式两端都除以‖g_k‖⁴得

进而有

因此

由此可知

这与(8) 式矛盾.因此结论成立.

3. 数值实验

为了验证提出的新共轭梯度算法的有效性，从文献[14]中选取几个测试函数测试，并与FR方法和MFR方法做比较，程序代码用Matlab编写.测试的环境为Matlab7.10.0，Win7.0操作系统，Intel(R) Core(TM) i5-2450M CPU @ 2.50 GHz 2.00 GB内存.参数的选取为：δ=0.001，σ=0.1，u=1.1.算法的终止条件为：

3种算法的实验结果见表 1，其中Dim为测试函数的维数；NI为迭代次数；NF为函数值计算的次数；NG为函数梯度计算的次数.

从表 1可知，本文算法数值性能最好.

参考文献 (14)

[1]	FLETCHER R, REEVES C M. Function Minimization by Conjugate Gradients [J]. The Computer Journal, 1964, 7(2): 149-154. doi: 10.1093/comjnl/7.2.149
[2]	POLYAK B T. The Conjugate Gradient Method in Extremal Problems [J]. Ussr Computational Mathematics and Mathematical Physics, 1969, 9(4): 94-112. doi: 10.1016/0041-5553(69)90035-4
[3]	doi: https://eudml.org/doc/193115 POLAK E, RIBIÉRE G. Note Surla Convergence de Méthodes de Directions Conjuguées. [J]. Rev. franaise Informat. recherche Opérationnelle, 1968, 16(16): 35-43.
[4]	HESTENES M R, STIEFEL E L. Methods of Conjugate Gradients for Solving Linear Systems [J]. Journal of Research of the National Bureau of Standards, 1952, 49(6): 409-436. doi: 10.6028/jres.049.044
[5]	LIU Y, STOREY C. Efficient Generalized Conjugate Gradient Algorithms, Part 1: Theory [J]. Journal of Optimization Theory and Applications, 1991, 69(1): 129-137. doi: 10.1007/BF00940464
[6]	DAI Y H, YUAN Y. A Nonlinear Conjugate Gradient Method with a Strong Global Convergence Property [J]. Siam Journal on Optimization, 1999, 10(1): 177-182. doi: 10.1137/S1052623497318992
[7]	FLETCHER R.Practical Methods of Optimization, Vol Ⅰ: Unconstrained Optimization [M]. New York: Wiley and Sons, 1987.
[8]	doi: http://www.oalib.com/references/13789575 ZOUTENDIJK G. Nonlinear Programming, Computational Methods [J]. Integer and Nonlinear Programming, 1970.
[9]	AL-BAALI M. Descent Property and Global Convergence of the Fletcher-Reeves Method with Inexact Line Search [C]. IMA Journal of Numerical Analysis. 2010: 121-124.
[10]	DAI Y H, YUAN Y. A Nonlinear Conjugate Gradient Method with a Strong Global Convergence Property [J]. Siam Journal on Optimization, 1999, 10(1): 177-182. doi: 10.1137/S1052623497318992
[11]	LIU G, HAN J, YIN H. Global Convergence of the Fletcher-Reeves Algorithm with Inexact Line Search [J]. APPL Math J China Univ, 1995, 10(1): 75-82. doi: 10.1007/BF02663897
[12]	doi: https://link.springer.com/article/10.1007/s11071-012-0694-6 JIANG X Z, JIAN J B. A Sufficient Descent Dai-Yuan Type Nonlinear Conjugate Gradient Method for Unconstrained Optimization Problems [J]. Nonlinear Dynamics, 2013, 72(72): 101-112.
[13]	戴彧虹.非线性共轭梯度法[M].上海:上海科学技术出版社, 2000.
[14]	doi: http://www.doc88.com/p-999213967147.html ANDREI N. An Unconstrained Optimization Test Functions Collection [J]. Adv Model Optim, 2008, 10(1): 147-161.

留言板