基于PRP公式修正的有效共轭梯度算法

林穗华

doi:10.13718/j.cnki.xdzk.2017.07.015

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名

姓名不能为空！

邮箱

邮箱不能为空！非法的邮箱地址。

手机号码

电话不能为空！

请输入有效手机号!

标题

标题不能为空！

留言内容

内容不能为空！

验证码

验证码不能为空！

验证码错误！

基于PRP公式修正的有效共轭梯度算法

广西民族师范学院数学与计算机科学学院，广西崇左 532200

基金项目: 国家自然科学基金项目(11261006)；广西高校科研项目(ZD2014143)；广西重点培育学科(应用数学)建设项目(桂教科研[2013]16)；广西民族师范学院科研项目(2013RCGG002)

详细信息

作者简介:
林穗华(1973-)，女，广西龙州人，副教授，主要从事最优化理论与方法研究 .

中图分类号: O221.2

Efficient Conjugate Gradient Algorithms Based on a Modified PRP Formula

College of Mathematics and Computer Science, Guangxi Normal University for Nationalities, Chongzuo Guangxi 532200, China

摘要: 给出一种非负且带有调比因子的修正PRP共轭梯度法参数公式.基于该共轭参数公式，采用SWP线搜索的对应共轭梯度算法满足充分下降性，采用WWP线搜索的对应谱共轭梯度算法保持下降性.在常规假设条件下，证明了算法的全局收敛性，数值实验结果表明算法是有效的.

Abstract: A non-negative modified PRP conjugate gradient method parameter formula with disturbance is presented in this paper. Based on the new conjugate parameter formula, the corresponding conjugate gradient algorithm with the SWP line search satisfies the sufficient descent, and the corresponding spectral conjugate gradient algorithm with the WWP line search keeps decreasing. Under conventional assumptions, the global convergence of the two algorithms is proved. The results of a numerical experiment show that the new algorithms are effective.

Key words:

测试函数

维数/
维

算法1/次
NI/NF/NG

算法2/次
NI/NF/NG

VPRP/次
NI/NF/NG

PRP/次
NI/NF/NG

ROSE

50/143/111

51/101/74

45/116/90

29/206/75

FROTH

17/33/28

35/55/45

24/51/44

15/127/24

BEALE

24/50/41

42/66/53

25/52/41

13/27/23

JENSAM

18/37/29

22/37/29

14/31/23

16/34/28

HELIX

113/196/178

78/115/98

67/142/116

52/108/87

BARD

39/74/60

44/73/59

38/77/62

65/126/105

GAUSS

4/8/6

5/9/7

5/10/8

4/57/6

GULF

2/52/3

SING

489/890/754

202/322/265

388/760/608

130/256/201

WOOD

234/507/426

304/540/416

228/478/388

139/275/234

KOWOSB

92/178/146

171/292/232

53/112/89

217/433/348

BIGGS

2577/5078/4021

OSB2

398/713/629

1140/1630/1377

457/838/730

WATSON

9519/18204/14559

ROSEX

53/155/128

73/130/99

32/129/97

26/188/66

ROSEX

39/103/81

74/151/110

61/150/117

24/178/87

ROSEX

100

40/115/87

91/209/130

45/135/102

SINGX

453/879/698

156/249/205

314/605/483

174/394/275

PEN1

78/180/147

73/202/115

44/145/102

34/240/108

PEN2

403/1008/766

1112/1988/1502

717/1702/1280

124/377/274

PEN2

173/378/312

305/575/423

189/443/347

1620/3337/2658

VARDIM

11/13/13

8/11/11

11/13/13

4/9/8

VARDIM

19/37/37

39/56/56

19/37/37

15/34/34

TRIG

22/44/37

35/55/45

21/46/38

22/48/39

TRIG

53/95/87

61/94/76

47/80/75

48/86/77

TRIG

100

62/130/108

84/121/103

61/105/99

57/108/99

17/34/27

34/46/41

16/32/26

136/232/213

330/457/394

399/688/616

118/202/183

500

719/903/902

234/318/272

537/690/689

314/416/415

1 000

99/139/138

20/27/23

107/151/150

42/61/60

2 000

2/4/3

8/14/13

12/17/15

7/14/13

6/13/11

6/13/12

12/17/15

6/13/12

6/12/11

100

7/15/15

13/18/16

7/15/15

7/14/14

200

7/8/8

9/12/11

7/11/11

7/13/12

500

9/12/12

13/17/16

8/12/12

8/15/14

1 000

9/13/13

12/16/15

8/13/13

10/17/16

2 000

9/13/13

14/18/17

9/14/14

8/13/13

TRID

17/31/27

24/35/29

17/28/25

14/25/21

TRID

29/36/36

36/49/43

30/38/38

29/43/43

TRID

100

35/52/52

35/50/42

31/37/37

31/51/51

TRID

200

38/51/51

37/50/44

33/52/52

31/49/48

TRID

500

34/44/44

35/47/42

34/43/43

33/50/48

TRID

1 000

40/48/47

37/51/45

37/58/58

33/48/48

TRID

2 000

42/48/48

38/52/46

34/43/43

34/57/57

BAND

10/14/14

12/17/15

10/14/14

15/19/19

BAND

36/44/44

30/39/36

31/41/41

22/83/34

BAND

100

32/44/43

29/38/35

26/36/36

23/42/38

BAND

200

31/41/41

27/37/34

33/40/40

BAND

500

48/57/57

28/38/35

27/36/36

21/35/33

BAND

1 000

81/90/90

30/40/37

25/35/35

22/38/37

BAND

2 000

35/44/44

29/39/36

46/54/54

24/42/39

LIN

1/3/3

3/5/5

1/3/3

LIN

1/3/3

LIN

500

1/3/3

LIN

1 000

1/3/3

LIN

2 000

1/3/3

LIN1

10/11/11

6/8/8

10/11/11

2/4/4

LIN1

1/3/3

3/5/5

1/3/3

LIN0

1/3/3

3/5/5

1/3/3

注：F表示计算失效或终止时未达计算精度.

基于PRP公式修正的有效共轭梯度算法

作者简介: 林穗华(1973-)，女，广西龙州人，副教授，主要从事最优化理论与方法研究
广西民族师范学院数学与计算机科学学院，广西崇左 532200

收稿日期: 2016-08-15

关键词:

全文HTML

考虑无约束优化问题：

其中目标函数f： ${{\mathbb{R}}^{n}}\to \mathbb{R}$ 连续可微，梯度函数g(x) $\triangleq $ ∇f(x)，g_k $\triangleq $ g(x_k)，f_k $\triangleq $ f(x_k).共轭梯度法是求解大型优化问题(1) 的一种有效方法，迭代格式如下

其中：d_k为搜索方向，α_k为步长因子，β_k为共轭方向调控参数.共轭参数的选取影响着算法的收敛性和计算效果.著名的共轭梯度法PRP，FR的β_k表达式如下

其中‖·‖为欧氏范数. PRP方法具备优秀的数值特性，但即使采用精确线搜索，对非凸目标函数仍不能确保其收敛性^[1]，不少研究者对β_k^PRP公式作了非负性的改进^[2-6]，解决了收敛性问题.文献[3]对β_k^PRP公式修改得到

0≤β_k^WYL≤2β_k^FR，WYL方法继承了PRP方法优秀的数值特性.文献[6]对公式(4) 再修改得到

0≤β_k^VPRP≤β_k^FR，β_k^VPRP与β_k^WYL一样满足文献[2]为PRP方法提出的性质(*)，文献[7]还将公式(5) 的分子部分推广到其他共轭梯度法公式上，也取得了较好的效果.

基于文献[3, 6]的思路，本文考虑对β_k^PRP公式作如下改进

易得0≤β_k≤2β_k^FR，但β_k不再满足性质(*).受文献[8]的启发，对公式(6) 再修正得到

其中

建立在参数β_k^N公式上的相应共轭梯度算法和谱共轭梯度算法具有良好的收敛性和较为理想的数值表现.

1. 修正PRP共轭梯度算法及谱共轭梯度算法

基于参数公式(7)，采用强Wolfe-Powell线搜索(SWP)的修正PRP共轭梯度算法如下：

算法1

步骤1 给定初值 ${{\mathit{\boldsymbol{x}}}_{1}}\in {{\mathbb{R}}^{n}}$ ，δ∈(0，0. 5)，σ∈(δ，0. 5)，μ≥1，ε≥0，d₁：=-g₁，k：=1.若‖g_k‖≤ε，停止.

步骤2 计算步长α_k满足以下SWP线搜索准则：

步骤3 计算x_k+1=x_k+α_kd_k.若‖g_k+1‖≤ε，停止.

步骤4 由(7) 式计算参数β_k+1，由(3) 式计算d_k+1.

步骤5 k：=k+1，转步骤2.

谱共轭梯度法是一种特殊共轭梯度法^[9]，通过调整谱参数θ_k和共轭参数β_k，易使设计的算法满足下降性和收敛性.为降低线搜索条件，受文献[10-16]的启发，设计基于参数公式(7) 并采用弱Wolfe-Powell线搜索(WWP)的修正PRP谱共轭梯度算法如下：

算法2

步骤1 给定初值 ${{x}_{1}}\in {{\mathbb{R}}^{n}}$ ，δ∈(0，0. 5)，σ∈(δ，0. 5)，μ≥1，ε≥0，d₁：=-g₁，k：=1.若‖g_k‖≤ε，停止.

步骤2 计算步长α_k满足WWP线搜索准则：(8) 式和下式

步骤3 计算x_k+1=x_k+α_kd_k.若‖g_k+1‖≤ε，停止.

步骤4 由(7) 式计算参数β_k+1，由下式计算搜索方向d_k+1：

其中

步骤5 k：=k+1，转步骤2.

算法的收敛性证明需要共轭梯度法的常规假设条件：

(ⅰ)设水平集Ω={ $\mathit{\boldsymbol{x}}\in {{\mathbb{R}}^{n}}$ |f(x)≤f(x₁)}有界，其中x₁为初始点.

(ⅱ) f(x)在Ω的某邻域N上连续可微且导数满足Lipschitz条件，即存在常数L＞0，使得

本文以下算法的收敛性分析中均假设‖g_k‖≠0，否则目标函数的稳定点已获得，算法自动终止.

2. 修正PRP共轭梯度算法的全局收敛性

引理1 考虑参数 $\sigma \in \left( 0,\frac{1}{2} \right)$ ，μ≥1，则存在常数 ${{c}_{1}}=\frac{1-2\sigma }{1-\sigma }\in \left( 0,1 \right),{{c}_{2}}=\frac{1}{1-\sigma }\in \left( 1,2 \right)$ ，使算法1产生的方向序列{d_k}满足充分下降条件

证因β_k^N的调比因子

所以由(7) 式，可知

当k=1时，d₁=-g₁，g₁^Td₁=-‖g₁‖²，显然(13) 式成立.假设k＞1时(13) 式成立，则g_k^Td_k＜0.

(3) 式两端与g_k+1^T作内积，并利用(9) 和(14) 式，可得

利用(15) 式及(14) 式，可得

上式两边除以-‖g_k+1‖²，可得

利用(16) 式递推，可得

由归纳法知，引理成立.

由引理1及文献[1]引理1.4.1，可得以下引理.

引理2 若假设(ⅰ)，(ⅱ)成立，则算法1产生的序列{g_k，d_k}满足Zoutendijk条件： $\sum\limits_{k\ge 1}{\frac{{{\left\| {{\mathit{\boldsymbol{g}}}_{k}} \right\|}^{4}}}{{{\left\| {{\mathit{\boldsymbol{d}}}_{k}} \right\|}^{2}}}}＜+\infty $ .

定理1 若假设(ⅰ)，(ⅱ)成立，{g_k}为算法1产生的序列，则有

证若定理结论不成立，即

则存在常量γ＞0，使得

(3) 式两端取模平方，可得

(18) 式两边除以‖g_k‖⁴，再由(9) 式和(13)，(14)，(17) 式，可得

由(19) 式，可得

3. 修正PRP谱共轭梯度算法的全局收敛性

引理3 考虑算法2产生的序列{g_k，d_k，β_k^N}，则∀k≥1有

证当k=1时，d₁=-g₁，则g₁^Td₁=-‖g₁‖²＜0.假设k≥1时g_k^Td_k＜0，从而由(10) 与(12) 式得d_k^Ty_k≥(σ-1)g_k^Td_k＞0.下证g_k+1^Td_k+1＜0.

(11) 式两端与g_k+1作内积，可得

由(14) 式知0≤β_k+1^N≤β_k+1^FR.若β_k+1^N＞0，则上式可得

若β_k+1=0，则结合d_k^Ty_k＞0可得

由归纳法知，∀k≥1，g_k^Td_k＜0成立.再由(21) 式可得

引理得证.

引理3说明算法2产生的搜索方向d_k满足下降性.根据文献[1]引理1.4.1，易得以下结论.

引理4 若假设(ⅰ)，(ⅱ)成立，{g_k，d_k}为算法2产生的序列，则

定理2 若假设(ⅰ)，(ⅱ)成立，{g_k}为算法2生成的序列，则有

证若定理不成立，则存在常数r＞0，使任意k≥1有‖g_k‖≥r.

由(11) 式移项得d_k+θ_kg_k=β_kd_k-1，两端取模平方，再除以(g_k^Td_k)²，并利用(20) 式，可得

从而可得

上式与引理4矛盾，由反证法知定理成立.

4. 数值实验

为检验本文提出的修正PRP共轭梯度法的计算效果，给出算法1和算法2的数值实验结果如表 1.测试函数源于文献[17]，算法运行环境为Matlab 2011b和Windows7操作系统.终止条件为‖g_k‖≤10^-6，或迭代次数超过9 999. 表 1中NI/NF/NG分别表示算法迭代次数、目标函数计算迭代次数、梯度函数计算迭代次数，其它符号说明如下：

算法1中参数μ=1.15，δ=0.001，σ=0.25；算法2中参数μ=4.2，δ=0.1，σ=0.9；PRP与VPRP采用SWP线搜索，δ=0.001，σ=0.25.

本文对PRP公式进行非负修正并添加适当的调比因子.基于新参数公式的两个算法分别适用SWP和WWP步长线搜索，具有良好的收敛性.虽然新参数β_k^N不再满足性质(*)，但数值实验结果显示算法1优于表中其他方法，能解决更多的问题.同时，谱共轭梯度形式的算法2比标准共轭梯度形式的算法1收敛条件弱，但计算效果却没算法1好，如何调整两个方向调控参数，使谱共轭梯度算法达到更佳的计算效果，需要进一步的研究.

参考文献 (17)

[1]	戴彧虹, 袁亚湘.非线性共轭梯度法[M].上海:上海科学技术出版社, 2001: 30-42.
[2]	doi: https://hal.archives-ouvertes.fr/inria-00075291/document GILBERT J C, NOCEDAL J. Global Convergence Properties of Conjugate Gradient Methods for Optimization [J]. SIAM J Optim, 1992(2) : 21-42.
[3]	doi: https://www.researchgate.net/profile/Shengwei_Yao/publication/238800505_The_convergence_properties_of_some_new_conjugate_gradient_methods/links/02e7e5283451f69af1000000.pdf WEI Z X, YAO S W, LIU L Y. The Convergence Properties of Some New Conjugate Gradient Methods [J]. Appl Math Comput, 2006, 183(2): 1341-1350.
[4]	YU G H, GUAN L T, LIU L Y. Global Convergence of Modified Polak-Ribiere-Polyak Conjugate Gradient Methods with Sufficient Descent Property [J]. J Ind Mang Optim, 2008, 4: 565-579. doi: 10.3934/jimo
[5]	黎勇.一类修正PRP共轭梯度法的全局收敛性及其数值试验结果[J].西南大学学报(自然科学版), 2011, 33(11): 23-28. doi: http://xbgjxt.swu.edu.cn/jsuns/jsuns/ch/reader/view_abstract.aspx?file_no=xnnydxxb201111005&flag=1
[6]	doi: http://www.sciencedirect.com/science/article/pii/S1877705812011551 HUANG H D, LI Y J, WEI Z X. Global Convergence of a Modified PRP Conjugate Gradient Method [J]. J Math Res Exposition, 2010, 30(1): 141-148.
[7]	doi: http://linkinghub.elsevier.com/retrieve/pii/S0377042716301686 DU X W, ZHANG P, MA W Y. Some Modified Conjugate Gradient Methods for Unconstrained Optimization [J]. J Comput Appl Math, 2016, 305(1): 92-114.
[8]	JIANG X Z, JIAN J B. Two Modified Nonlinear Conjugate Gradient Methods with Disturbance Factors for Unconstrained Optimization [J]. Nonlinear Dyn, 2014, 77(1-2): 387-394. doi: 10.1007/s11071-014-1303-7
[9]	简金宝, 江羡珍, 尹江华.非线性共轭梯度法研究进展[J].玉林师范学院学报, 2016, 37(2): 3-10. doi: http://d.wanfangdata.com.cn/Periodical/ylsfxyxb201602003
[10]	林穗华, 黄海.一个新的谱共轭梯度法[J].工程数学学报, 2014, 31(6): 837-846. doi: http://www.cnki.com.cn/Article/CJFDTOTAL-NATR201402016.htm
[11]	李智群, 林浦任, 韦增欣.一种新的求解无约束优化问题的谱共轭梯度法[J].西南大学学报(自然科学版), 2016, 38(7): 115-120. doi: http://xbgjxt.swu.edu.cn/jsuns/jsuns/ch/reader/view_abstract.aspx?file_no=201607019&flag=1
[12]	林穗华.求解无约束优化问题的两个谱共轭梯度法的全局收敛性[J].重庆师范大学学报(自然科学版), 2015, 32(2): 1-6. doi: http://www.cnki.com.cn/Article/CJFDTOTAL-CQSF201502001.htm
[13]	黎勇, 韦增欣.一种自动充分下降的共轭梯度法[J].西南师范大学学报(自然科学版), 2016, 41(5): 36-40. doi: http://www.cnki.com.cn/Article/CJFDTOTAL-XNZK201605007.htm
[14]	赛·闹尔再, 张慧玲.修正LS共轭梯度方法及其收敛性[J].西南师范大学学报(自然科学版), 2016, 41(7): 20-26. doi: http://www.cnki.com.cn/Article/CJFDTOTAL-XNZK201607004.htm
[15]	张元园, 张俊容, 谢秉磊.一种修正的HS共轭梯度法及其全局收敛性[J].西南师范大学学报(自然科学版), 2012, 37(8): 40-45. doi: http://www.cnki.com.cn/Article/CJFDTOTAL-XNZK201605007.htm
[16]	林穗华. Wolfe线搜索下的修正FR谱共轭梯度法[J].山东大学学报(理学版), 2017, 52(4): 6-12. doi: 10.6040/j.issn.1671-9352.0.2016.406
[17]	MOREÈ J J, GARBOW B S, HILLSTROME K E. Testing Unconstrained Optimization Software [J]. ACM Trans Math Software, 1981, 7: 17-41. doi: 10.1145/355934.355936

留言板