留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

求解合作对策解的带有正不定临界项的对称交替方向法

上一篇

下一篇

李孟丽, 张俊容. 求解合作对策解的带有正不定临界项的对称交替方向法[J]. 西南师范大学学报(自然科学版), 2019, 44(5): 13-18. doi: 10.13718/j.cnki.xsxb.2019.05.003
引用本文: 李孟丽, 张俊容. 求解合作对策解的带有正不定临界项的对称交替方向法[J]. 西南师范大学学报(自然科学版), 2019, 44(5): 13-18. doi: 10.13718/j.cnki.xsxb.2019.05.003
Meng-li LI, Jun-rong ZHANG. On Solution of Cooperative Game Based on Symmetric Alternating Direction Method with Positive Indefinite Proximal Regularization[J]. Journal of Southwest China Normal University(Natural Science Edition), 2019, 44(5): 13-18. doi: 10.13718/j.cnki.xsxb.2019.05.003
Citation: Meng-li LI, Jun-rong ZHANG. On Solution of Cooperative Game Based on Symmetric Alternating Direction Method with Positive Indefinite Proximal Regularization[J]. Journal of Southwest China Normal University(Natural Science Edition), 2019, 44(5): 13-18. doi: 10.13718/j.cnki.xsxb.2019.05.003

求解合作对策解的带有正不定临界项的对称交替方向法

  • 基金项目: 国家自然科学基金项目(11701470)
详细信息
    作者简介:

    李孟丽(1991-), 女, 硕士研究生, 主要从事决策理论, 最优化算法研究 .

    通讯作者: 张俊容, 博士, 副教授
  • 中图分类号: O225

On Solution of Cooperative Game Based on Symmetric Alternating Direction Method with Positive Indefinite Proximal Regularization

  • 摘要: 主要研究合作对策解的问题:首先根据核心及Shapley值的特点引入了最公平核心的概念,再将最公平核心转化为具有线性约束的凸二次规划问题,最后运用带有正不定临界项的对称交替方向法对其求解.由于问题的可行域为简单闭凸集,因此算法是可行的.
  • 加载中
  • 图 1  局中人1所得

    图 2  局中人2所得

    图 3  局中人3所得

    表 1  2种算法结果表

    起始点y0 INPSALM算法 本文算法 INPSALM算法 本文算法
    (0,0,0,0) 79 52 (4.003,2.893,3.107) (4.000,2.899,3.101)
    (1,0,0,0) 103 79 (4.001,2.891,3.110) (4.000,2.897,3.103)
    (1,1,0,0) 86 39 (4.010,2.870,3.142) (4.000,2.899,3.101)
    (1,0,1,0) 92 65 (4.000,2.883,3.142) (4.000,2.898,3.102)
    下载: 导出CSV
  • [1] 巫红霞.基于改进Shapley权力指数的特征选择算法[J].西南师范大学学报(自然科学版), 2017, 42(11):62-71. doi: http://xbgjxt.swu.edu.cn/jsuns/jscnuhhse/ch/reader/view_abstract.aspx?file_no=x201711011&flag=1
    [2] 邹正兴, 高作峰, 张欣, 等.模糊支付合作对策的模糊Shapley值[J].西南师范大学学报(自然科学版), 2013, 38(11):51-58. doi: http://xbgjxt.swu.edu.cn/jsuns/jscnuhhse/ch/reader/view_abstract.aspx?file_no=20130004&flag=1
    [3] 谭春桥, 张强.合作对策理论及其应用[M].北京:科学出版社, 2010.
    [4] OWEN G.Values of Games with a Priori Unions[J].Mathematical Economics and Game Theory, 1977, 141:76-88. doi: 10.1007/978-3-642-45494-3
    [5] SHAPLEY L S.A Value for N-Person Games[M].Princeton:Princeton University Press, 1953.
    [6] GILLIES D.Some Theorems on N-Person Games[D].New Jersey: Princeton University, 1953: 33.
    [7] SCHMEIDLER D.The Nucleolus of a Characteristic Function Game[J].SIAM Journal on Applied Mathematics, 1969, 17(6):1163-1170. doi: 10.1137/0117107
    [8] NGUYEN T D.The Fairest Core in Cooperative Games with Transferable Utilities[J].Operations Research Letters, 2015, 43(1):34-39. doi: 10.1016/j.orl.2014.11.001
    [9] 王斯琪, 谢政, 戴丽.一种求解合作博弈最公平核心的非精确平行分裂算法[J].运筹学学报, 2016, 20(2):105-112. doi: http://d.old.wanfangdata.com.cn/Periodical/ycxxb201602010
    [10] GABAY D, MERCIER B.A Dual Algorithm for the Solution of Nonlinear Variational Problems via Finite Element Approximation[J].Computers and Mathematics with Applications, 1976, 2(1):17-40. doi: 10.1016/0898-1221(76)90003-1
    [11] HE B S, YUAN X M.On the O(1/n) Convergence Rate of the Douglas-Rachford Alternating Direction Method[J].SIAM Journal on Numerical Analysis, 2012, 50(2):700-709. doi: 10.1137/110836936
    [12] HE B S, YUAN X M.On Non-Ergodic Convergence Rate of Douglas-Rachford Alternating Direction Method of Multipliers[J].Numerische Mathematik, 2015, 130(3):567-577. doi: 10.1007/s00211-014-0673-6
    [13] ECKSTEIN J, BERTSEKAS D P.On the Douglas-Rachford Splitting Method and the Proximal Point Algorithm for Maximal Monotone Operators[J].Mathematical Programming, 1992, 55(1-3):293-318. doi: 10.1007/BF01581204
    [14] HE B S, YANG H, ZHANG C S.A Modified Augmented Lagrangian Method for a Class of Monotone Variational Inequalities[J].European Journal of Operational Research, 2004, 159(1):35-51. doi: 10.1016/S0377-2217(03)00385-0
    [15] GAO B, MA F.Symmetric Alternating Direction Method with Indefinite Proximal Regularization for Linearly Constrained Convex Optimization[J].Journal of Optimization Theory and Applications, 2018, 176(1):178-204. doi: 10.1007/s10957-017-1207-z
    [16] TAO M, YUAN X M.An Inexact Parallel Splitting Augmented Lagrangian Method for Monotone Variational Inequalities with Separable Structures[J].Computational Optimization and Applications, 2012, 52(2):439-461. doi: 10.1007/s10589-011-9417-z
  • 加载中
图( 3) 表( 1)
计量
  • 文章访问数:  1630
  • HTML全文浏览数:  1497
  • PDF下载数:  223
  • 施引文献:  0
出版历程
  • 收稿日期:  2018-09-30
  • 刊出日期:  2019-05-20

求解合作对策解的带有正不定临界项的对称交替方向法

    通讯作者: 张俊容, 博士, 副教授
    作者简介: 李孟丽(1991-), 女, 硕士研究生, 主要从事决策理论, 最优化算法研究
  • 西南大学 数学与统计学院, 重庆 400715
基金项目:  国家自然科学基金项目(11701470)

摘要: 主要研究合作对策解的问题:首先根据核心及Shapley值的特点引入了最公平核心的概念,再将最公平核心转化为具有线性约束的凸二次规划问题,最后运用带有正不定临界项的对称交替方向法对其求解.由于问题的可行域为简单闭凸集,因此算法是可行的.

English Abstract

  • 近年来,随着对策论研究的深入,其应用领域越来越广泛,比如文献[1-2]在权利指数以及模糊数学方面的应用.在这个多元化的时代,双方或者多方合作可以产生巨大利益,因此合作变得至为重要.而促进合作的最大动力是如何在局中人中合理分配所得利益,也就是如何找到合作对策的解.在合作对策(Nv)中,N={1,2,3…n}表示n个局中人组成的集合,N的任意一个非空子集S称为一个联盟,那么n个局中人组成2n个联盟.特征函数v表示联盟的总利益,而合作对策的解就是联盟中局中人对所得利益的一种分配方式[3].对于合作对策的分配x =(x1x2x3xn)T$ \mathbb{R}$n,其中xi表示局中人i所得份额,满足以下条件:

    条件(1)是个体合理性条件,条件(2)是群体合理性条件,合作对策的解需要满足(1),(2).

    合作对策有多种形式的解[4-7],其中最常用的就是核心[4]和Shapley值[5].文献[8]提出了合作对策的最公平核心的概念,它满足唯一性、稳定性以及一定程度上的公平性.

    文献[9]从超出值的角度通过添加人工变量y将求解合作对策的最公平核心转化为求解凸二次规划问题.但是随着联盟中局中人个数的增加,凸二次规划问题的约束条件的数目呈指数增长,此时原问题变为高维问题.求解凸二次规划问题的经典方法如内点法、罚函数法等已经不再适合.为此,许多学者针对这种难题研究了基于结构变分不等式的交替方向法[10-14].文献[15]的算法是一种带有正不定临界项的对称交互方向法(PIDSADMM),算法迭代一次参数更新两次,提高了收敛速度.本文受文献[9]的启发,运用文献[15]的算法求解最公平核心的解,提供了新的求解合作对策解的新思路.

  • 合作对策(Nv)的核心是非劣的分配的集合.对于分配x =(x1x2x3xn)∈$ \mathbb{R}$n,称集合

    为合作对策(Nv)的核心.其中v(S)表示联盟S中各局中人通过合作所得的最大利益,x(S)是分配给联盟S的值.由(3)式易知,核心C(v)是$ \mathbb{R}$n中的有界闭凸集.

    核心具有帕累托最优性、稳定性、匿名性、超可加性等好的性质.所以核心中的分配不仅满足个体理性和集体理性,而且满足联盟理性,即任何联盟离开核心所得收益都不超过在核心中的分配.因此在核心中的每个局中人都会努力保护核心成立,但是核心作为合作对策的解并不总是存在的,即使存在也不能保证唯一性,所以如何取得属于核心中的合作对策的解是一个值得研究的课题.

    Nguyen提出了最公平核心的概念:假设合作对策(Nv)具有非空核心,则最公平核心是如下优化问题的解:

    其中:ψ =(ψ1ψ2ψn)Tψi(i=1,2,…n)是局中人i的Shapley值

    (4) 式中|S|是联盟S中局中人的个数,最公平核心属于核心且与Shapley值有着最近的欧氏距离,即最公平核心是欧氏范数下ψC(v)上的投影:

    由于C(v)非空且为有界闭凸集,所以投影PC(v)(ψ)存在且唯一,即最公平核心是唯一的,这里也体现了最公平核心的唯一性.

    文献[8]通过生成随机最小支撑树的数值实验表明随着合作对策中局中人个数的增加,问题所具有的约束条件呈指数增长,此时求解最公平核心问题的难度不亚于寻找核心.而对于这种高维问题,求解凸二次规划问题的交替方向法有着非常显著的成效,因此把求解最公平核心问题转化为凸二次规划问题,再用交替方向法进行求解是本文的想法.

    考虑到联盟成立的个体合理性条件,求解合作对策的最公平核心与下列凸优化问题等价:

    在文献[9]中,通过添加人工变量y$ \mathbb{R}$m,将上述凸优化问题转化为以下凸二次规划问题:

    其中

    易知XY是简单闭凸集.矩阵A$ \mathbb{R}$m×n,每行非零元素均为1,m表示n个局中人组成的联盟个数,每行1的位置由联盟中的局中人是否被选择决定,即1表示局中人在联盟中,0表示局中人不在联盟中. b =(b1b2bm)T$ \mathbb{R}$m,对∀i∈{1,2,…m},bi等于矩阵A的第i行对应的联盟Si的支付vi.

    在文献[9]中采取非精确平行分裂算法(INPSALM)[16]求解问题(5),算法在运算中不能充分运用已知信息,且算法无法在已知信息较少的情况下运行.为此,本文给出了一种带有正不定临界项的对称交替方向法求解凸二次规划问题(5).

    首先将问题(5)转化为变分不等式的形式.

    定义可微函数θ$ \mathbb{R}$n$ \mathbb{R}$如下

    故得到(5)式的Lagrange函数为

    其中λ$ \mathbb{R}$m是Lagrange乘子.寻找(6)式的鞍点ω*=(x*y*λ*)T使得

    将其代入(6)式得到

    整理即得变分不等式结构:

    其中

    求得的鞍点ω*Ω即是使得变分不等式(7)成立的点.

    在将原约束问题转化为无约束问题时,现实中的原问题不一定都是强凸函数,同时为了加快算法的收敛速度,考虑(7)式的增广Lagrange函数

    其中:λ$ \mathbb{R}$m为Lagrange乘子,β>0是罚因子,即对违反等式约束的条件作出惩罚.应用文献[15]中算法(PIDSADMM)求解变分不等式(7),算法如下:

    Step 1:给定ε>0,α∈(-1,1),rβ>0,选取初始点ω0=(x0y0λ0)∈Ω,令k=0

    Step 2:对任意的ωk=(xkykλk)∈Ω,计算xk+1X${\boldsymbol{\lambda }^{k + \frac{1}{2}}} \in {\boldsymbol{\lambda }^m} $,满足

    Step 3:计算yk+1Yλk+1λm,满足

    Step 4:如果ek=max{‖ Axk+1- yk+1- b,‖βA (xk+1- xk)‖}≤ε,迭代停止.

    此时ωk+1=(xk+1yk+1λk+1)可作为凸二次规划问题(5)的解,否则令k=k+1,转至Step2.

    在这里,D0=(τr-β) Im$\tau \in \left[ {\frac{{{\alpha ^2} - \alpha + 4}}{{{\alpha ^2} - 2\alpha + 5}}, 1} \right)$.其实Step3中y的表达式等价于

    其中qk=β(Axk+1- yk- b)- ${\boldsymbol{\lambda }^{k + \frac{1}{2}}} $.

    PIDSADMM算法收敛性已经在文献[15]中证明.容易证明由PIDSADMM算法计算出的结果即为凸二次规划模型(5)的解,且Lagrange乘子在一次迭代中更新两次,具有较好的收敛率.对于一个固定的r只需要选取适当的临界系数使得临界项在目标函数中占有较小的比重,临界项中矩阵D0的不定性可允许算法在可行域有较大的最优步长从而加快算法的数值收敛.对于给定的初始点(ykλk),通过上述算法产生下一个迭代点ωk+1=(xk+1yk+1λk+1),即在已知初始信息较少的情况下问题仍然可以解决,且变量在迭代过程中交替更新的方式使得信息应用更加充分.由于XY均为有界闭凸集合,所以以上算法是可以计算的.

  • 本节运用PIDSADMM算法求解一对合作对策的最公平核心的示例来说明算法的可行性.与文献[16]中的算法运算的结果进行对比分析可知算法的有效性.

    例1   求解下列一对合作对策的最公平核心,其特征函数v满足:

    首先由(4)式计算三人合作对策的Shapley值为$\boldsymbol{\psi }\left( v \right) = {\left( {\begin{array}{*{20}{c}} {\frac{{14}}{3}, }&{\frac{{13}}{6}, }&{\frac{{19}}{6}} \end{array}} \right)^{\text{T}}} $.由于ψ2+ψ3 < v({2,3}),故Shapley值不在核心中,此时Shapley值的分配方式并不一定使每个局中人都满意,比如局中人2和3,因此合作将面临破裂的危险.易知该合作对策核心为C(v)={(4,3- x,3+ x)|0≤ x ≤2},即核心存在但是不唯一,故无法通过核心的分配方式解决该问题.而最公平核心属于核心且满足唯一性、稳定性以及一定程度的公平性,因此求解合作对策的最公平核心是有必要的.下面通过matlab R2014a编码,在型号为270E4V的计算机上操作求解合作对策的最公平核心:根据本例的约束条件,将求解最公平核心转化为求解凸二次规划问题时可得:

    计算时,相关参数取α=0.95, r=1.05,β=1.01,算法迭代的初始值记为 ω0=(x0y0λ0)T,其中λ0=(0,0,0,0)Ty0分别取值为(0,0,0,0)T,(1,0,0,0)T,(1,1,0,0)T,(1,0,1,0)T.下面以迭代次数k为横坐标,分别以局中人x1x2x3所得为纵坐标,初始值取y0=(1,1,0,0)T时给出局中人在计算过程中迭代变化情况的图示(图 1-3).事实上,理论及数值实验表明,y0在可行域内的任意取值并不影响局中人输出的最终结果.

    图 1-3也可以看出随着迭代次数的增加,各局中人所得值的变化趋于稳定,当迭代次数到达39次之后,各局中人所得近似值收敛到(4.000,2.899,3.101)T.由于最公平核心属于核心,因此所得结果必定在核心的可行域内,由输出的局中人所得值也可得到这一点.比如核心中局中人2的所得分配范围为(1,3),由于人工变量y最终仍要为0,所以局中人2所得分配有一些波动,但是最终变化趋势稳定,输出值约为2.899,这显然和核心中的分配一致.

    为了更好说明本文算法的有效性,分别用本文算法以及INPSALM算法[16]计算本例,计算结果见表 1.

    由数据表 1可知,本文算法能够有效求解合作对策的最公平核心,与INPSALM算法相比,本文算法计算的迭代次数有所降低并且计算结果更加稳定,这一特点在局中人增多时更加有用,可以保证统一分配,避免纠纷,提高效率以及保证合作持续进行.

  • 本文主要通过添加人工变量y将合作对策的最公平核心转化为凸二次规划问题,运用求解凸二次规划问题的带有正不定临界项的对称交替方向法(PIDSADMM)算法求解,可行域的简单闭凸性保证了算法收敛到最公平核心,同时也减少了算法的迭代次数,提高了收敛速度.简单的示例说明了该方法的可行性和有效性,为求解合作对策的解提供了新思路.但是本文算法依赖于参数的选择,这也是需要改进的部分.

参考文献 (16)

目录

/

返回文章
返回