求解合作对策解的带有正不定临界项的对称交替方向法

李孟丽; 张俊容

doi:10.13718/j.cnki.xsxb.2019.05.003

摘要: 主要研究合作对策解的问题：首先根据核心及Shapley值的特点引入了最公平核心的概念，再将最公平核心转化为具有线性约束的凸二次规划问题，最后运用带有正不定临界项的对称交替方向法对其求解.由于问题的可行域为简单闭凸集，因此算法是可行的.

Abstract: In this paper, the solution of cooperative game has been considered. Firstly, the definition of the fairest core has been introduced according to the characteristics of the Core and the Shapley value. Secondly, the fairest core has been translated to the convex quadratic programming problem with linear constraint. Finally, the symmetric alternating direction method has been used with positive indefinite proximal regularization to solve the problem. Since the feasible domain is simple closed convex set, the algorithm can be computed.

Key words:

全文HTML

近年来，随着对策论研究的深入，其应用领域越来越广泛，比如文献[1-2]在权利指数以及模糊数学方面的应用.在这个多元化的时代，双方或者多方合作可以产生巨大利益，因此合作变得至为重要.而促进合作的最大动力是如何在局中人中合理分配所得利益，也就是如何找到合作对策的解.在合作对策(N，v)中，N={1，2，3…n}表示n个局中人组成的集合，N的任意一个非空子集S称为一个联盟，那么n个局中人组成2ⁿ个联盟.特征函数v表示联盟的总利益，而合作对策的解就是联盟中局中人对所得利益的一种分配方式^[3].对于合作对策的分配x =(x₁，x₂，x₃…x_n)^T∈$ \mathbb{R}$ⁿ，其中x_i表示局中人i所得份额，满足以下条件：

条件(1)是个体合理性条件，条件(2)是群体合理性条件，合作对策的解需要满足(1)，(2).

合作对策有多种形式的解^[4-7]，其中最常用的就是核心^[4]和Shapley值^[5].文献[8]提出了合作对策的最公平核心的概念，它满足唯一性、稳定性以及一定程度上的公平性.

文献[9]从超出值的角度通过添加人工变量y将求解合作对策的最公平核心转化为求解凸二次规划问题.但是随着联盟中局中人个数的增加，凸二次规划问题的约束条件的数目呈指数增长，此时原问题变为高维问题.求解凸二次规划问题的经典方法如内点法、罚函数法等已经不再适合.为此，许多学者针对这种难题研究了基于结构变分不等式的交替方向法^[10-14].文献[15]的算法是一种带有正不定临界项的对称交互方向法(PIDSADMM)，算法迭代一次参数更新两次，提高了收敛速度.本文受文献[9]的启发，运用文献[15]的算法求解最公平核心的解，提供了新的求解合作对策解的新思路.

1. 最公平核心的凸二次规划模型及其求解算法

合作对策(N，v)的核心是非劣的分配的集合.对于分配x =(x₁，x₂，x₃…x_n)∈$ \mathbb{R}$ⁿ，称集合

为合作对策(N，v)的核心.其中v(S)表示联盟S中各局中人通过合作所得的最大利益，x(S)是分配给联盟S的值.由(3)式易知，核心C(v)是$ \mathbb{R}$ⁿ中的有界闭凸集.

核心具有帕累托最优性、稳定性、匿名性、超可加性等好的性质.所以核心中的分配不仅满足个体理性和集体理性，而且满足联盟理性，即任何联盟离开核心所得收益都不超过在核心中的分配.因此在核心中的每个局中人都会努力保护核心成立，但是核心作为合作对策的解并不总是存在的，即使存在也不能保证唯一性，所以如何取得属于核心中的合作对策的解是一个值得研究的课题.

Nguyen提出了最公平核心的概念：假设合作对策(N，v)具有非空核心，则最公平核心是如下优化问题的解：

其中：ψ =(ψ₁，ψ₂…ψ_n)^T，ψ_i(i=1，2，…n)是局中人i的Shapley值

(4) 式中|S|是联盟S中局中人的个数，最公平核心属于核心且与Shapley值有着最近的欧氏距离，即最公平核心是欧氏范数下ψ在C(v)上的投影：

由于C(v)非空且为有界闭凸集，所以投影P_C(v)(ψ)存在且唯一，即最公平核心是唯一的，这里也体现了最公平核心的唯一性.

文献[8]通过生成随机最小支撑树的数值实验表明随着合作对策中局中人个数的增加，问题所具有的约束条件呈指数增长，此时求解最公平核心问题的难度不亚于寻找核心.而对于这种高维问题，求解凸二次规划问题的交替方向法有着非常显著的成效，因此把求解最公平核心问题转化为凸二次规划问题，再用交替方向法进行求解是本文的想法.

考虑到联盟成立的个体合理性条件，求解合作对策的最公平核心与下列凸优化问题等价：

在文献[9]中，通过添加人工变量y ∈$ \mathbb{R}$^m，将上述凸优化问题转化为以下凸二次规划问题：

其中

易知X，Y是简单闭凸集.矩阵A ∈$ \mathbb{R}$^m×n，每行非零元素均为1，m表示n个局中人组成的联盟个数，每行1的位置由联盟中的局中人是否被选择决定，即1表示局中人在联盟中，0表示局中人不在联盟中. b =(b₁，b₂…b_m)^T∈$ \mathbb{R}$^m，对∀i∈{1，2，…m}，b_i等于矩阵A的第i行对应的联盟S_i的支付v_i.

在文献[9]中采取非精确平行分裂算法(INPSALM)^[16]求解问题(5)，算法在运算中不能充分运用已知信息，且算法无法在已知信息较少的情况下运行.为此，本文给出了一种带有正不定临界项的对称交替方向法求解凸二次规划问题(5).

首先将问题(5)转化为变分不等式的形式.

定义可微函数θ：$ \mathbb{R}$ⁿ→$ \mathbb{R}$如下

故得到(5)式的Lagrange函数为

其中λ ∈$ \mathbb{R}$^m是Lagrange乘子.寻找(6)式的鞍点ω^*=(x^*，y^*，λ^*)^T使得

将其代入(6)式得到

整理即得变分不等式结构：

其中

求得的鞍点ω^*∈Ω即是使得变分不等式(7)成立的点.

在将原约束问题转化为无约束问题时，现实中的原问题不一定都是强凸函数，同时为了加快算法的收敛速度，考虑(7)式的增广Lagrange函数

其中：λ ∈$ \mathbb{R}$^m为Lagrange乘子，β>0是罚因子，即对违反等式约束的条件作出惩罚.应用文献[15]中算法(PIDSADMM)求解变分不等式(7)，算法如下：

Step 1：给定ε>0，α∈(-1，1)，r≥β>0，选取初始点ω⁰=(x⁰，y⁰，λ⁰)∈Ω，令k=0

Step 2：对任意的ω^k=(x^k，y^k，λ^k)∈Ω，计算x^k+1∈X和${\boldsymbol{\lambda }^{k + \frac{1}{2}}} \in {\boldsymbol{\lambda }^m} $，满足

Step 3：计算y^k+1∈Y和λ^k+1∈λ^m，满足

Step 4：如果e_k=max{‖ Ax^k+1- y^k+1- b ‖_∞，‖βA (x^k+1- x^k)‖_∞}≤ε，迭代停止.

此时ω^k+1=(x^k+1，y^k+1，λ^k+1)可作为凸二次规划问题(5)的解，否则令k=k+1，转至Step2.

在这里，D₀=(τr-β) I_m，$\tau \in \left[ {\frac{{{\alpha ^2} - \alpha + 4}}{{{\alpha ^2} - 2\alpha + 5}}, 1} \right)$.其实Step3中y的表达式等价于

其中q_k=β(Ax^k+1- y^k- b)- ${\boldsymbol{\lambda }^{k + \frac{1}{2}}} $.

PIDSADMM算法收敛性已经在文献[15]中证明.容易证明由PIDSADMM算法计算出的结果即为凸二次规划模型(5)的解，且Lagrange乘子在一次迭代中更新两次，具有较好的收敛率.对于一个固定的r只需要选取适当的临界系数使得临界项在目标函数中占有较小的比重，临界项中矩阵D₀的不定性可允许算法在可行域有较大的最优步长从而加快算法的数值收敛.对于给定的初始点(y^k，λ^k)，通过上述算法产生下一个迭代点ω^k+1=(x^k+1，y^k+1，λ^k+1)，即在已知初始信息较少的情况下问题仍然可以解决，且变量在迭代过程中交替更新的方式使得信息应用更加充分.由于X，Y均为有界闭凸集合，所以以上算法是可以计算的.

3. 结论

本文主要通过添加人工变量y将合作对策的最公平核心转化为凸二次规划问题，运用求解凸二次规划问题的带有正不定临界项的对称交替方向法(PIDSADMM)算法求解，可行域的简单闭凸性保证了算法收敛到最公平核心，同时也减少了算法的迭代次数，提高了收敛速度.简单的示例说明了该方法的可行性和有效性，为求解合作对策的解提供了新思路.但是本文算法依赖于参数的选择，这也是需要改进的部分.

参考文献 (16)

姓名
	姓名不能为空！
邮箱
	邮箱不能为空！非法的邮箱地址。
手机号码
	电话不能为空！请输入有效手机号!
标题
	标题不能为空！
留言内容
	内容不能为空！
验证码
	验证码不能为空！验证码错误！

起始点y₀	INPSALM算法	本文算法	INPSALM算法	本文算法
(0，0，0，0)	79	52	(4.003，2.893，3.107)	(4.000，2.899，3.101)
(1，0，0，0)	103	79	(4.001，2.891，3.110)	(4.000，2.897，3.103)
(1，1，0，0)	86	39	(4.010，2.870，3.142)	(4.000，2.899，3.101)
(1，0，1，0)	92	65	(4.000，2.883，3.142)	(4.000，2.898，3.102)

[1]	巫红霞.基于改进Shapley权力指数的特征选择算法[J].西南师范大学学报(自然科学版), 2017, 42(11):62-71. doi: http://xbgjxt.swu.edu.cn/jsuns/jscnuhhse/ch/reader/view_abstract.aspx?file_no=x201711011&flag=1
[2]	邹正兴, 高作峰, 张欣, 等.模糊支付合作对策的模糊Shapley值[J].西南师范大学学报(自然科学版), 2013, 38(11):51-58. doi: http://xbgjxt.swu.edu.cn/jsuns/jscnuhhse/ch/reader/view_abstract.aspx?file_no=20130004&flag=1
[3]	谭春桥, 张强.合作对策理论及其应用[M].北京:科学出版社, 2010.
[4]	OWEN G.Values of Games with a Priori Unions[J].Mathematical Economics and Game Theory, 1977, 141:76-88. doi: 10.1007/978-3-642-45494-3
[5]	SHAPLEY L S.A Value for N-Person Games[M].Princeton:Princeton University Press, 1953.
[6]	GILLIES D.Some Theorems on N-Person Games[D].New Jersey: Princeton University, 1953: 33.
[7]	SCHMEIDLER D.The Nucleolus of a Characteristic Function Game[J].SIAM Journal on Applied Mathematics, 1969, 17(6):1163-1170. doi: 10.1137/0117107
[8]	NGUYEN T D.The Fairest Core in Cooperative Games with Transferable Utilities[J].Operations Research Letters, 2015, 43(1):34-39. doi: 10.1016/j.orl.2014.11.001
[9]	王斯琪, 谢政, 戴丽.一种求解合作博弈最公平核心的非精确平行分裂算法[J].运筹学学报, 2016, 20(2):105-112. doi: http://d.old.wanfangdata.com.cn/Periodical/ycxxb201602010
[10]	GABAY D, MERCIER B.A Dual Algorithm for the Solution of Nonlinear Variational Problems via Finite Element Approximation[J].Computers and Mathematics with Applications, 1976, 2(1):17-40. doi: 10.1016/0898-1221(76)90003-1
[11]	HE B S, YUAN X M.On the O(1/n) Convergence Rate of the Douglas-Rachford Alternating Direction Method[J].SIAM Journal on Numerical Analysis, 2012, 50(2):700-709. doi: 10.1137/110836936
[12]	HE B S, YUAN X M.On Non-Ergodic Convergence Rate of Douglas-Rachford Alternating Direction Method of Multipliers[J].Numerische Mathematik, 2015, 130(3):567-577. doi: 10.1007/s00211-014-0673-6
[13]	ECKSTEIN J, BERTSEKAS D P.On the Douglas-Rachford Splitting Method and the Proximal Point Algorithm for Maximal Monotone Operators[J].Mathematical Programming, 1992, 55(1-3):293-318. doi: 10.1007/BF01581204
[14]	HE B S, YANG H, ZHANG C S.A Modified Augmented Lagrangian Method for a Class of Monotone Variational Inequalities[J].European Journal of Operational Research, 2004, 159(1):35-51. doi: 10.1016/S0377-2217(03)00385-0
[15]	GAO B, MA F.Symmetric Alternating Direction Method with Indefinite Proximal Regularization for Linearly Constrained Convex Optimization[J].Journal of Optimization Theory and Applications, 2018, 176(1):178-204. doi: 10.1007/s10957-017-1207-z
[16]	TAO M, YUAN X M.An Inexact Parallel Splitting Augmented Lagrangian Method for Monotone Variational Inequalities with Separable Structures[J].Computational Optimization and Applications, 2012, 52(2):439-461. doi: 10.1007/s10589-011-9417-z

留言板