留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

一种新的混合共轭梯度算法

上一篇

下一篇

韩信, 张俊容, 王森森. 一种新的混合共轭梯度算法[J]. 西南大学学报(自然科学版), 2017, 39(5): 132-138. doi: 10.13718/j.cnki.xdzk.2017.05.020
引用本文: 韩信, 张俊容, 王森森. 一种新的混合共轭梯度算法[J]. 西南大学学报(自然科学版), 2017, 39(5): 132-138. doi: 10.13718/j.cnki.xdzk.2017.05.020
Xin HAN, Jun-rong ZHANG, Sen-sen WANG. A New Hybrid Conjugate Gradient Algorithm[J]. Journal of Southwest University Natural Science Edition, 2017, 39(5): 132-138. doi: 10.13718/j.cnki.xdzk.2017.05.020
Citation: Xin HAN, Jun-rong ZHANG, Sen-sen WANG. A New Hybrid Conjugate Gradient Algorithm[J]. Journal of Southwest University Natural Science Edition, 2017, 39(5): 132-138. doi: 10.13718/j.cnki.xdzk.2017.05.020

一种新的混合共轭梯度算法

  • 基金项目: 国家自然科学基金项目(11401487)
详细信息
    作者简介:

    韩信(1989-),男,四川平昌人,硕士研究生,主要从事最优化理论、算法及应用的研究 .

    通讯作者: 张俊容,博士,副教授; 
  • 中图分类号: O224

A New Hybrid Conjugate Gradient Algorithm

  • 摘要: 根据现有的共轭梯度算法,提出了一种新的求解无约束优化问题的混合共轭梯度法.在每一步迭代过程中,新算法总是能生成一个充分下降方向.在Wolfe线搜索下,提出的算法具有全局收敛性.数值实验表明该算法具有良好的计算性能.
  • 加载中
  • 表 1  数值结果

    F M n I T/s Ng S
    almost perturbed quadratic HZW 200 133 1 287.3296 5.043 9e-07 1
    DPRP 200 218 2 137.986 1 8.406 9e-07 1
    YWH 200 140 1 380.108 6 9.525 6e-07 1
    DY 200 143 1 376.910 3 9.474 7e-07 1
    almost perturbed quadratic HZW 300 139 2 300.400 1 6.697 3e-07 1
    DPRP 300 185 3 099.127 5 6.394 6e-07 1
    YWH 300 187 3 207.550 9 9.708 4e-07 1
    DY 300 156 2 666.627 2 9.011 7e-07 1
    bdexp HZW 50 5 401.361 0 8.994 9e-07 1
    DPRP 50 5 409.253 5 8.994 9e-07 1
    YWH 50 5 414.313 9 9.068 9e-07 1
    DY 50 5 407.241 4 4.323 2e-07 1
    bdexp HZW 100 6 1 538.670 6 6.782 3e-08 1
    DPRP 100 6 1 543.582 1 6.782 3e-08 1
    YWH 100 6 1 549.907 9 6.696 4e-08 1
    DY 100 6 1 544.107 6 5.174 5e-08 1
    diagonal 2 HZW 50 46 229.907 7 8.224 0e-07 1
    DPRP 50 65 330.462 3 6.206 8e-07 1
    YWH 50 51 256.398 9 8.203 8e-07 1
    DY 50 85 430.923 1 8.724 5e-07 1
    diagonal 2 HZW 100 72 1 180.823 7 6.570 0e-07 1
    DPRP 100 107 1 808.820 1 6.228 3e-07 1
    YWH 100 77 1 265.915 5 7.555 6e-07 1
    DY 100 114 1 913.785 1 8.984 1e-07 1
    diagonal 7 HZW 50 11 32.708 5 2.448 0e-07 1
    DPRP 50 36 109.504 3 4.067 3e-07 1
    YWH 50 13 37.897 5 9.442 5e-07 1
    DY 50 75 214.572 5 8.426 7e-08 1
    diagonal 7 HZW 100 11 75.330 9 3.462 1e-07 1
    DPRP 100 35 246.199 9 8.479 5e-07 1
    YWH 100 14 94.927 7 9.351 7e-07 1
    DY 100 71 471.018 7 2.489 4e-07 1
    dixmaane HZW 45 49 193.611 2 9.374 0e-07 1
    DPRP 45 168 621.496 1 9.600 3e-07 1
    YWH 45 56 214.102 9 8.991 7e-07 1
    DY 45 65 238.271 9 9.623 8e-07 1
    dixmaane HZW 120 86 1 707.232 9 8.872 7e-07 1
    DPRP 120 186 3 608.628 5 1.366 6e-05 0
    YWH 120 87 1 713.985 7 7.833 6e-07 1
    DY 120 107 2 026.692 2 9.359 3e-07 1
    dixmaang HZW 51 55 688.351 1 5.922 9e-07 1
    DPRP 51 156 1 816.333 1 7.589 6e-07 1
    YWH 51 61 751.846 7 9.787 7e-07 1
    DY 51 63 741.821 7 9.742 9e-07 1
    dixmaang HZW 120 80 3 478.780 1 7.269 6e-07 1
    DPRP 120 86 3 641.523 9 1.300 0e-03 0
    YWH 120 79 3 577.304 2 7.2217e-07 1
    DY 120 88 3 609.186 8 1.559 6e-05 0
    dqdrtic HZW 50 90 208.688 1 4.627 6e-07 1
    DPRP 50 365 872.746 3 7.603 0e-07 1
    YWH 50 123 293.283 4 7.288 9e-07 1
    DY 50 216 542.869 3 9.926 9e-07 1
    dqdrtic HZW 150 88 701.850 9 5.379 4e-07 1
    DPRP 150 309 2 495.1985 7.940 7e-07 1
    YWH 150 115 917.457 2 9.064 1e-07 1
    DY 150 111 894.757 2 4.201 2e-07 1
    himmelbg HZW 100 4 272.922 8 9.325 4e-07 1
    DPRP 100 6 449.434 1 1.446 6e-07 1
    YWH 100 6 444.254 6 3.667 6e-07 1
    DY 100 4 277.838 4 5.134 2e-07 1
    himmelbg HZW 500 5 2 737.837 1 1.196 4e-07 1
    DPRP 500 6 3 347.309 4 3.234 6e-07 1
    YWH 500 6 3 326.077 1 8.200 9e-08 1
    DY 500 5 2 755.178 9 3.718 9e-08 1
    liarwhd HZW 20 40 167.762 9 8.287 9e-07 1
    DPRP 20 79 342.065 5 5.603 9e-07 1
    YWH 20 52 210.689 8 8.837 7e-07 1
    DY 20 108 466.299 1 3.989 3e-07 1
    raydan 1 HZW 60 72 327.976 1 9.502 9e-07 1
    DPRP 60 91 436.074 8 7.375 8e-07 1
    YWH 60 98 513.077 9 6.147 0e-07 1
    DYW 60 73 339.826 4 9.975 7e-07 1
    raydan 2 HZW 200 5 61.820 7 5.674 8e-07 1
    DPRP 200 6 75.304 7 5.657 0e-12 1
    YWH 200 6 79.011 4 3.245 3e-09 1
    DY 200 8 99.840 1 9.307 3e-07 1
    raydan 2 HZW 1 000 6 2 951.566 3 2.457 6e-14 1
    DPRP 1 000 6 2 991.777 1 1.264 6e-11 1
    YWH 1 000 6 3 004.285 7 7.256 8e-09 1
    DY 1 000 8 3 976.370 8 2.081 2e-06 0
    下载: 导出CSV
  • [1] FLETCHER R, REEVES C. Function Minimization by Conjugate Gradients[J]. Computer Journal, 1964, 7(2): 149-154. doi: 10.1093/comjnl/7.2.149
    [2] doi: http://www.academia.edu/14162511/A_Nonlinear_Conjugate_Gradient_Method_with_a_Strong_Global_Convergence_Property DAI Y H, YUAN Y X. A Nonlinear Conjugate Gradient Method with a Strong Global Convergence Property[J]. SIAM Journal of Optimization, 2000, 10(1): 177-182.
    [3] FLETCHER R. Practical Methods of Optimization, Unconstrained Optimization[M]. New York: John Wiley and Sons, 1987.
    [4] POLAK E, RIBIÉRE G. Note Sur La Convergence De Directions Conjuguéee[J]. Rev Francaise Infromat Recherche Operationelle 3e Année, 1969, 16(16): 35-43.
    [5] POLIAK B T. The Conjugate Gradient Method in Extreme Problems[J]. USSR Computational Mathematics and Mathematical Physics, 1969, 9(4): 94-112. doi: 10.1016/0041-5553(69)90035-4
    [6] HESTENES M R, STIEFEL E L. Methods of Conjugate Gradients for Solving Linear Systems[J]. Journal of Research of National Bureau of Standards, 1952, 49(6): 409-436. doi: 10.6028/jres.049.044
    [7] LIU Y, STOREY C. Efficient Generalized Conjugdte Gradient Algorithms[J]. Journal of Optimization Theory Application, 1991, 69(1): 129-137. doi: 10.1007/BF00940464
    [8] WEI Z, LI G, QI L. New Nonlinear Conjugate Gradient Formulas for Large-Scale Unconstrained Optimization Problems[J]. Applied Mathematics and Computation, 2006, 179(2): 407-430. doi: 10.1016/j.amc.2005.11.150
    [9] YAO S W, WEI Z X, HUANG H. A Note about WYL's Conjugate Gradient and Its Application[J]. Applied Mathematics and Computation, 2007, 191(2): 381-388. doi: 10.1016/j.amc.2007.02.094
    [10] DAI Z F, WEN F H. Another Improved Wei-Yao-Liu Nonlinear Conjugate Gradient Method with Sufficient Descent Property[J]. Applied Mathematics and Computation, 2012, 218(14): 7421-7430. doi: 10.1016/j.amc.2011.12.091
    [11] doi: https://www.researchgate.net/publication/265512350_A_hybrid_conjugate_gradient_method_with_descent_property_for_unconstrained_optimization JIAN J B, HAN L, JIANG X Z. A Hybrid Conjugate Gradient Method with Descent Property for Unconstrained Optimization[J]. Applied Mathematical Modelling, 2014, 39(3-4): 1281-1290.
    [12] GILBERT J C, NOCEDAL J. Global Convergence Properties of Conjugate Gradient Methods for Optimization[J]. SIAM Journal of Optimization, 1992, 2(1): 21-42. doi: 10.1137/0802003
    [13] doi: https://www.researchgate.net/publication/228737339_An_unconstrained_optimization_test_functions_collection ANDREI N. An Unconstrained Optimization Test Functions Collection[J]. Advanced Modeling and Optimization, 2008, 10(1): 147-161.
  • 加载中
表( 1)
计量
  • 文章访问数:  933
  • HTML全文浏览数:  504
  • PDF下载数:  199
  • 施引文献:  0
出版历程
  • 收稿日期:  2016-03-27
  • 刊出日期:  2017-05-20

一种新的混合共轭梯度算法

    通讯作者: 张俊容,博士,副教授; 
    作者简介: 韩信(1989-),男,四川平昌人,硕士研究生,主要从事最优化理论、算法及应用的研究
  • 西南大学 数学与统计学院,重庆 400715
基金项目:  国家自然科学基金项目(11401487)

摘要: 根据现有的共轭梯度算法,提出了一种新的求解无约束优化问题的混合共轭梯度法.在每一步迭代过程中,新算法总是能生成一个充分下降方向.在Wolfe线搜索下,提出的算法具有全局收敛性.数值实验表明该算法具有良好的计算性能.

English Abstract

  • 考虑下面的无约束优化问题

    其中f:ℝn→ ℝ是连续可微函数,ℝn表示n维欧氏空间,gf的梯度向量,即g(x)=∇f(x).共轭梯度法是求解无约束优化问题(1) 的一种十分有效的算法.该算法的一般迭代格式如下:

    这里αk是由某种线搜索获得的迭代步长,并且

    为搜索方向,βk为共轭参数.迭代步长αk通常由如下的Wolfe线搜索

    或者强Wolfe线搜索

    获得.这里δσ均为参数,且0<δσ<1.对于共轭参数βk的选取[1-7],有如下6种经典的形式:

    其中:yk-1=gk-gk-1,‖·‖代表欧氏范数.

    上面的6种算法的全局收敛性和数值表现有所不同.众所周知,虽然FR法、DY法和CD法实际计算效果一般,但是它们具有很好的全局收敛性;另外,尽管PRP法、HS法和LS法在一般情形下可能不收敛,但是它们具有良好的数值表现.在以上方法的基础上,很多学者试着构造一种既具有好的收敛性质又具有优秀的数值表现的新算法.一种思路是直接对上面的共轭参数βk进行改良,例如文献[8-10].另外就是将收敛性好和数值计算性能优良的方法进行有效混合,例如文献[11].

    2006年,文献[8]提出了FR法的一种改进形式:

    其中:μ1∈(0,+∞),μ2∈(μ1+ε1,+∞),μ3∈(0,+∞),且ε1为给定的正参数.在任意线搜索条件下,该方法都具有充分下降性.

    此后,文献[9]给出了HS法的一种改良公式:

    在强Wolfe线搜索条件(5) 下,若0<σ$ \frac{1}{3} $,则该算法能生成充分下降方向并且具有全局收敛性.

    最近,基于文献[8]的想法,文献[10]引进了PRP法的一种修正形式:

    其中参数μ>1.在任意线搜索条件下,该方法都具有充分下降性.在Wolfe线搜索条件(4) 下,该算法具有全局收敛性.

    受文献[8]和[10]的启示,本文提出了一种新的混合共轭梯度方法HZW法,其共轭参数如下:

    其中参数u>1.由(8) 式易得,βkHZWβkDPRPβkYWHβkVFRβkDY的一种混合.新的混合算法HZW法继承了DPRP法、YWH法、VFR法和DY法的优点,既具有好的全局收敛性又有出色的数值表现.

  • 基于(8) 式,我们将给出新的混合共轭梯度法HZW的算法步骤.

    HZW算法

    步骤0  给定初始点x1和精度ε>0.令k:=1,并计算d1=g1.

    步骤1  若‖gk‖≤ε,停止.否则,转步骤2.

    步骤2  按Wolfe线搜索(4) 式,计算迭代步长αk.

    步骤3  由xk+1=xk+αkdkgk+1=g(xk+1)生成新的迭代点并根据(8) 式计算βk+1HZW.

    步骤4  由dk+1=-gk+1+βk+1HZWdk计算新的搜索方向.令k:=k+1,转步骤1.

    下面,我们将给出算法HZW中的共轭参数βkHZW所具有的性质.

    引理1 若共轭参数βkHZW由(8) 式定义,则

    证 根据βkHZW的定义,有

    另一方面,对βkHZW适当放大,就有

    综上,结论得证.

    下面的引理将说明算法HZW具有充分下降性.

    引理2 若目标函数f(x)是光滑的.设{gk}和{dk}是由算法HZW生成的序列.则

    对任意的k≥1都成立,其中cu均为参数,且c=1-$ \frac{1}{u}$u>1.

     由βkHZW的定义和(9) 式,可知

    结合(3) 式,有

    从而,结论得证.

  • 为了证明算法HZW的全局收敛性,下面给出一些标准假设:

    假设A 目标函数f(x)的水平集ℒ={x∈ℝnf(x)≤f(x1)}有界,其中x1为所给的初始点.

    假设B 在ℒ的某个邻域$\mathcal{N} $内,目标函数f(x)在$\mathcal{N} $上连续可微且导函数g(x)在$\mathcal{N} $上Lipschitz连续,即存在常数L>0,使得

    接下来给出著名的Zoutendijk条件.该引理经常被用来证明共轭梯度算法的全局收敛性.

    引理3[12] 假设A和B都成立.考虑形如(2) 式和(3) 式的任意迭代算法,若搜索方向dk是一个下降方向,步长αk满足Wolfe线搜索条件(4),则

    根据(11) 式,不难得到与Zoutendijk条件(13) 等价的不等式

    现在,我们建立算法HZW的全局收敛定理.

    定理1 假设A和B都成立. {gk}和{dk}是由算法HZW生成的序列,则

     假设(15) 式不成立,即存在常数r>0以及无穷多个k,有

    在(3) 式中,令βk=βkHZW.当k≥2时,对(3) 式两边取模的平方,可得

    βkHZW的定义和(12) 式,可知

    将(10) 式和(18) 式应用到(17) 式中,有

    (19) 式两边同时除以‖gk4,可得

    对(20) 式,使用递归法.并注意到

    就有

    结合(16) 式和(21) 式,有

    (22) 式说明

    这与(14) 式相矛盾,也即与引理3矛盾.因此,原结论成立.

  • 为了清楚的检验算法HZW的实际计算效果利用文献[13]中的11个测试函数进行数值测验.现将要比较的算法,一一列举如下:

    DY:戴彧虹和袁亚湘[2]提出的经典算法,共轭参数βk=βkDY

    YWH:文献[9]引进的算法,共轭参数βk=βkYWH由(6) 式给出;

    DPRP:文献[10]定义的算法,共轭参数βk=βkDPRP由(7) 式给出;

    HZW:本文所提出的算法,共轭参数βk=βkHZW由(8) 式确定.

    实验采用Wolfe线搜索条件(4),并且均利用MATLAB编程实现.算法测试的环境是Windows 7操作系统,AMD Athlon(tm) Ⅱ Dual-Core M320 2.00 GB内存.算法中参数取值为:u=1.1,δ=0.000 1,σ=0.1.终止条件为:‖gk‖≤10-7,或者算法的迭代时间超过3 600 s.将HZW算法与DPRP,YWH以及DY法进行比较,20个算例详细报告见表 1.在表 1中:F为测试函数的名称;M为共轭梯度算法的名称;n为测试函数的维数;I为算法解决某一测试问题的迭代次数;T为算法解决某一测试问题的计算时间;Ng为算法解决某一测试问题的最终梯度范数,即‖gk‖;S为若算法的终止条件满足,令S=1,否则,令S=0.

    表 1的测试结果表明,算法HZW的计算性能比另外3种算法要好得多.另外,DPRP法在求解120维dixmaane问题与dixmaang问题时迭代失败,DY法在求解120维dixmaang问题和1 000维raydan2问题时迭代失败,但HZW法和YWH法均迭代成功.

  • 本文构造的算法HZW,在任何线搜索条件下,都具有充分下降性.采用Wolfe线搜索时,算法HZW具有良好的全局收敛性,且在实际计算中,具有出色的数值表现.

参考文献 (13)

目录

/

返回文章
返回