留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

求解大规模非光滑优化问题的一种修正Hestenes-Stiefel共轭梯度算法

上一篇

下一篇

黎勇, 袁功林. 求解大规模非光滑优化问题的一种修正Hestenes-Stiefel共轭梯度算法[J]. 西南大学学报(自然科学版), 2018, 40(5): 81-88. doi: 10.13718/j.cnki.xdzk.2018.05.013
引用本文: 黎勇, 袁功林. 求解大规模非光滑优化问题的一种修正Hestenes-Stiefel共轭梯度算法[J]. 西南大学学报(自然科学版), 2018, 40(5): 81-88. doi: 10.13718/j.cnki.xdzk.2018.05.013
Yong LI, Gong-lin YUAN. A Modified Hestenes-Stiefel Conjugate Gradient Algorithm for Large-Scale Nonsmooth Optimization Problems[J]. Journal of Southwest University Natural Science Edition, 2018, 40(5): 81-88. doi: 10.13718/j.cnki.xdzk.2018.05.013
Citation: Yong LI, Gong-lin YUAN. A Modified Hestenes-Stiefel Conjugate Gradient Algorithm for Large-Scale Nonsmooth Optimization Problems[J]. Journal of Southwest University Natural Science Edition, 2018, 40(5): 81-88. doi: 10.13718/j.cnki.xdzk.2018.05.013

求解大规模非光滑优化问题的一种修正Hestenes-Stiefel共轭梯度算法

  • 基金项目: 国家自然科学基金项目(11661001,11661009);广西自然科学基金项目(2014GXNSFAA118030);广西教育厅科研项目(YB2014389);广西中青年教师能力提升项目(KY2016YB417)
详细信息
    作者简介:

    黎勇(1973-),男,壮族,副教授,主要从事最优化理论与方法的研究 .

  • 中图分类号: O224

A Modified Hestenes-Stiefel Conjugate Gradient Algorithm for Large-Scale Nonsmooth Optimization Problems

  • 摘要: 利用Moreau-Yosida正则化技术和非单调线搜索技术,设计了一种针对大规模非光滑优化问题的修正Hestenes-Stiefel共轭梯度算法.该算法的搜索方向不仅自动满足充分下降条件,而且属于信赖域.在适当条件下,新算法全局收敛.初步的数值实验也表明新算法对于求解大规模非光滑无约束凸优化问题是有效的.
  • 加载中
  • 表 1  测试问题

    序号 测试问题 x0
    1 Generalization of MAXQ $\left({1, 2, \cdots, \frac{n}{2}, - \frac{n}{{2 + 1}} \cdots, - n} \right)$
    2 Chained LQ (-0.5,-0.5,…)
    3 Number of active faces (1,1,…)
    4 Nonsmoothgeneralization of Brown function 2 (1,0,…)
    5 Chained crescent (-1.5,2,…)
    6 Chained crescent 2 (1,0,…)
    下载: 导出CSV

    表 2  数值结果

    序号 维数 MHS
    Ni/Nf/f(x)
    LMBM
    Ni/Nf/f(x)
    1 3 000 239/4971/6.955 650 353 842 63×10-8 94 144/96 680/1.134 215 823 070 18×10-5
    6 000 253/5272/6.726 138 641 769 14×10-8 245 066/250 174/565628885146208×10-5
    20 000 272/5697/6.433 270 442 007 30×10-8 1 419 971/1 450 334/1.563 108 595 262 89×10-4
    50 000 286/5991/6.599 447 300 897 05×10-8 4 999 996/5 000 000/5.776 229 182 256 93×102
    2 3 000 11/55/2.793 039 194 309 49×10-6 275/1373/-4.241 179 314 955 21×105
    6 000 11/56/2.793 504 856 062 3×10-6 314/1847/-8.483 777 056 063 14×105
    20 000 12/59/4.656 385 164 455 58×10-6 572/3 665/-2.828 279 647 277 23×106
    50 000 22/79/1.164 132 379 879 49×10-5 582/2 998/-7.070 920 052 968 46×106
    3 3 000 60/1156/1.461 567 777 860 02×10-6 1576/1 577/1.554 743 000 887 91×10-10
    6 000 65/1261/2.116 923 651 896 82×10-6 3085/3 086/1.548 308 148 238 18×10-10
    20 000 75/1471/3.700 806 349 456 93×10-6 10 090/100 91/4.714 519 884 484 46×10-10
    50 000 82/1618/5.888 908 804 180 25×10-6 25 070/25 101/1.463 351 438 952 38×10-9
    4 3 000 12/58/2.793 039 473 613 58×10-6 542/5145/6.227 226 749 432 59×10-8
    6 000 12/59/2.793 505 135 412 75×10-6 951/8278/8.841 189 430 325 71×10-4
    20 000 13/62/4.656 385 630 092 92×10-6 746/7446/2.711 495 095 809 97×10-8
    50 000 23/82/1.164 132 496 293 23×10-5 1293/10995/7.265 354 767 529 77×10-7
    5 3 000 15/122/4.325 183 552 422 73×10-7 199/591/3.844 034 424 105 30×10-9
    6 000 16/124/8.641 743 994 841 63×10-7 135/177/5.965 544 059 455 29×10-2
    20 000 17/127/1.439 280 695 292 31×10-6 198/279/2.417 616 116 197 71×102
    50 000 26/146/1.798 779 903 361 41×10-6 391/725/4.756 805 394 023 90×10-9
    6 3 000 13/61/2.618 998 658 832 08×10-6 757/6162/2.669 729 354 299 88×10-3
    6 000 13/62/2.619 173 781 637 23×10-6 1163/11352/1.068 332 415 193 75×10-3
    20 000 23/82/8.730 995 607 830 75×10-6 1353/12333/3.886 503 606 216 34×10-4
    50 000 42/121/1.091 389 351 826 07×10-5 4657/61720/8.010 423 366 732 19×10-4
    下载: 导出CSV
  • [1] doi: http://dx.doi.org/10.1090/S0025-5718-08-02031-0 POLAK E, RIBIERE G. Note Sur La Convergence de Directions Conjugèes [J]. Revue Francaise Informatique Recherche Operationnelle, 3e Annèe, 1969, 16(3): 35-43.
    [2] POLYAK B T. The Conjugate Gradient Method in Extreme Problem [J]. USSR Computational Mathematics and Mathematical Physics, 1969, 9(4): 94-112. doi: 10.1016/0041-5553(69)90035-4
    [3] HESTENES M R, STIEFEL E. Method of Conjugate Gradient for Solving Linear Equation [J]. Journal of Research of the National Bureau of Standards, 1952, 49(6): 409-436. doi: 10.6028/jres.049.044
    [4] LIU Y, STOREY C. Efficient Generalized Conjugate Gradient Algorithms, Part 1: Theory [J]. Journal of Optimization Theory and Application, 1991, 69(1): 129-137. doi: 10.1007/BF00940464
    [5] doi: https://academic.oup.com/comjnl/article/7/2/149/335311 FLETCHER R, REEVES C. Function Minimization by Conjugate Gradients [J]. The Computer Journal, 1964, 7(12): 149-154.
    [6] doi: https://dialnet.unirioja.es/servlet/articulo?codigo=4524555&info=resumen YUAN G. L, WEI Z X, LI G Y. A Modified Polak-Ribière-Polyak Conjugate Gradient Algorithm for Nonsmooth Convex Programs [J]. Journal of Computational and Applied Mathematics, 2014, 255(1): 86-96.
    [7] doi: https://link.springer.com/article/10.1007/BF01585756 BONNAN J F, GILBERT J C, LEMARECHAL C, et al. A Family of Variable Metric Proximal Methods [J]. Mathematical Programming, 1995, 68(1): 15-47.
    [8] doi: https://link.springer.com/article/10.1007/BF01585170 CORREA R, LEMARECHAL C. Convergence of some Algorithms for Convex Minimization [J]. Mathematical Programming, 1993, 62(1): 261-273.
    [9] HIRIART-URRUTY J B, LEMARECHAL C. Convex Analysis and Minimization Algorithms Ⅱ [M]. Berlin: Springer, 1993.
    [10] FUKUSHIMA M, QI L. A Global and Superlinearly Convergent Algorithm for Nonsmooth Convex Minimization [J]. SIAM Journal on Optimization, 1996, 6(4): 1106-1120. doi: 10.1137/S1052623494278839
    [11] doi: http://dx.doi.org/10.1137/S1052623403428208 ZHANG H, HARGER W W. A Nonmonotone Line Search Technique and Its Application to Unconstrained Optimization [J]. SIAM Journal on Optimization, 2006, 14(4): 1043-1056.
    [12] HAARALA M, MIETTINEN K, MAKELA M M. New Limited Memory Bundle Method for Large-Scale Nonsmooth Optimization [J]. Optimization Methods and Software, 2004, 19(6): 673-692. doi: 10.1080/10556780410001689225
  • 加载中
表( 2)
计量
  • 文章访问数:  1343
  • HTML全文浏览数:  751
  • PDF下载数:  168
  • 施引文献:  0
出版历程
  • 收稿日期:  2016-12-20
  • 刊出日期:  2018-05-20

求解大规模非光滑优化问题的一种修正Hestenes-Stiefel共轭梯度算法

    作者简介: 黎勇(1973-),男,壮族,副教授,主要从事最优化理论与方法的研究
  • 1. 百色学院 数学与统计学院,广西 百色 533000
  • 2. 广西大学 数学与信息科学学院,南宁 530004
基金项目:  国家自然科学基金项目(11661001,11661009);广西自然科学基金项目(2014GXNSFAA118030);广西教育厅科研项目(YB2014389);广西中青年教师能力提升项目(KY2016YB417)

摘要: 利用Moreau-Yosida正则化技术和非单调线搜索技术,设计了一种针对大规模非光滑优化问题的修正Hestenes-Stiefel共轭梯度算法.该算法的搜索方向不仅自动满足充分下降条件,而且属于信赖域.在适当条件下,新算法全局收敛.初步的数值实验也表明新算法对于求解大规模非光滑无约束凸优化问题是有效的.

English Abstract

  • 非线性共轭梯度法由于具有算法简单、所需的存储需求小等特点,被广泛应用于大规模光滑无约束优化问题的求解,出现了如PRP[1-2],HS[3],LS[4],FR[5]等一批经典的共轭梯度算法.然而在实际生活中,我们经常会碰到大规模的非光滑优化问题,如图形图像处理、生物工程等等.充分利用共轭梯度法的特点来求解非光滑凸优化问题是一个有意义的问题,目前这方面的研究成果还比较少.文献[6]提出了一种新的修正Polak-Ribière-Polyak共轭梯度法,通过利用Moreau-Yosida正则化技术,并结合非单调线搜索,新算法能够有效解决非光滑凸优化问题.同时,文献[6]也提出了一个修正Hestenes-Stiefel(HS)参数公式,但是并未进一步设计相应的共轭梯度法,也未对方法的收敛性质和数值效果做讨论.本文将以修正HS参数公式为基础建立相应的共轭梯度算法,并讨论其相关性质.

  • 考虑如下非光滑无约束优化问题:

    其中f:ℝn→ ℝ是凸函数(可能非光滑).

    目标函数f经过Moreau-Yosida正则化后记作F:ℝn→ ℝ:

    这里参数λ>0,‖·‖指欧氏范数.令

    并定义

    因为ψ(zx)对每一个固定的x强凸,所以h(x)唯一.因此函数F(x)可以表示为

    根据文献[7-9]容易知道F具有以下重要性质:

    (ⅰ) F是有限凸函数,且处处可微:

    进一步地,g:ℝn→ ℝnLipschitz连续,即

    (ⅱ) x是(1)式的最优解当且仅当▽F(x)=0,即h(x)=x.

    从以上定义容易看出,F(x)和g(x)可以通过argminz∈ℝnψ(zx)的最优解来获得.然而argminz∈ℝnψ(zx)=h(x)很难精确求出,甚至不可能.因此在实际计算中,不能用精确的h(x)去定义F(x)和g(x).由于对∀x∈ℝnε>0,存在向量hα(xε)∈ℝn,使得

    因此,当ε充分小的时候,可用hα(xε)近似定义F(x)和g(x):

    这样定义的Fα(xε)和gα(xε)有以下重要性质:

    命题1  设hα(xε)满足(5)式,Fα(xε)和gα(xε)分别由(6),(7)式定义,则有

    以上命题说明,可以通过选取充分小的参数ε,使得Fα(xε)和gα(xε)无限接近F(x)和g(x).命题1及其证明详见文献[10].

  • 针对非光滑无约束凸优化问题(1),Yuan等在文献[6]提出一个修正HS参数公式:

    这里yk*=yk+γk*skyk=gα(xk+1εk+1)-gα(xkεk),sk=xk+1-xkdk是搜索方向,常数c>0,并且

    但相应算法并未建立.本文将在参数公式(11)基础上,结合非单调Armijo-type线搜索,提出以下包含函数值信息的求解非光滑问题的修正HS共轭梯度法.通过研究,该算法不仅自动满足充分下降条件,而且搜索方向属于信赖域.在适当条件下,证明了新算法全局收敛.初步的数值实验也表明新算法在求解非光滑无约束凸优化问题方面是有效的.

    算法1

    步骤1  取x0∈ℝnγ0∈(0,1),σ∈(0,1),c>0,s>0,λ>0,ρ∈[0, 1],Q0=1,R0=Fα(x0ε0),d0=-gα(x0ε0),γ∈(0,1),令k=0.

    步骤2  若‖gα(xkεk)‖<γ,则停止;否则进行步骤3.

    步骤3  选取一个标量εk+1满足0<εk+1εk,利用以下非单调Armijo-type线搜索计算步长tk

    其中tk=s2-ikik∈{0,1,2,…}.

    步骤4  令xk+1=xk+tkdk,若‖gα(xk+1εk+1)‖<γ,则停止;否则进行步骤5.

    步骤5  利用以下公式校正Rk

    步骤6  利用(12)式计算搜索方向dk+1.

    步骤7  令k:=k+1,转步骤2.

    算法中的非单调Armijo-type线搜索(12)选自文献[11],ρ是控制非单调程度的参数.当ρ=0时,线搜索(12)就是普通的单调Armijo-type线搜索.

    引理1  对所有k$\mathbb{N}$∪{0},以下充分下降条件成立:

     当k=0时,

    (14)式显然成立.

    k≥1时,由(11)式,有

    (14)式成立.证毕.

    引理2  对所有k$\mathbb{N}$∪{0},以下信赖域性质成立:

     由(11)式得

    因为

    所以

    证毕.

  • 算法1的全局收敛性的证明需要用到以下假设:

    假设 A  (ⅰ)设目标函数f经Moreau-Yosida正则化后得到F,则存在常数M>0,使得

    (ⅱ) F有下界.

    (ⅲ)序列{εk}收敛于0.

    根据文献[11],我们得到以下引理:

    引理3  若假设A成立,针对算法1中的每一个k,有

    其中

    而且满足Armijo-type线搜索(12)的步长tk存在.

    引理4  若假设A成立,序列{(xktk)}由算法1产生,假设

    则存在常数m>0,使得步长tk满足:

     设步长tk满足线搜索(12)式.下面用反证法证明.

    假设tk→0,则存在

    满足

    把引理3中的Fα(xkεk)≤RkCk代入上式,可得

    由(8),(18)式及假设A,并利用泰勒展开式,有

    因为

    根据(10),(14)式及εk+1εk,由(19)式可得

    再由εk=o(tk2dk2)和(15)式,上式变为

    不等式两边除以tk并同取极限,得

    矛盾.故假设不成立.命题得证.

    根据引理1-4证明算法1的全局收敛性:

    定理1  设引理4的条件都成立,则

    且序列{xk}的聚点即为问题(1)的最优解.

     先证明

    用反证法.假设(21)式不成立,则存在正数γ0>0和k0>0,使得

    利用(12),(14),(17),(22)式,得

    由(13)式可得:

    由假设A知F有下界,因而Fα(xε)有下界.又由引理3知对所有的kFα(xkεk)≤Rk,因此不难知道Rk有下界.因而根据(23)式,有

    但由于根据Qk+1的定义(13)式容易得到Qk+1k+2,因此

    这与(24)式矛盾.因此(21)式成立.

    另一方面,由(10)式有

    因而结合假设A(ⅲ),即可得到

    x*是序列{xk}的聚点,则存在子序列{xk}K满足

    根据(3)式以及F(x)的性质易知

    因此由(25)和(26)式可知

    成立,故x*是问题(1)的最优解.证毕.

  • 为了考查本文所提算法对大规模非光滑优化问题的数值表现,本文对该方法进行数值实验,并将数值结果与LMBM(limited memory bundle method)方法[12]结果进行比较.测试问题选自文献[12],所采用的程序是在文献[12]的程序基础上利用Fortran语言修改而得,操作系统为Windows 7,软件平台为Fortran90,处理器为Pentium Dual E5800 3.20 GHz,内存为2.0 GB,参数选取如下:s=λ=1,ρ=0.5,σ=0.8,${\varepsilon _k}{\rm{ = }}\frac{1}{{{{\left({k{\rm{ + 2}}} \right)}^2}}}$;终止条件为‖gα(xε)‖≤10-15,迭代次数Ni>104时算法失效.

    表 1列出了测试问题名称及初始点,表 2则列出两种方法数值实验的结果,其中x0表示初始点, Ni为迭代次数, Nf表示函数值的计算次数, f(x)为近似最优点的函数值.

    表 2容易看出,新算法不仅能够有效求解50 000维的非光滑问题,而且相比求解非光滑问题的传统LMBM算法优势明显.由此可以认为,新算法对大规模非光滑无约束凸优化问题的求解是有效的.

参考文献 (12)

目录

/

返回文章
返回