-
博弈论又被称为对策论,是研究决策者在决策过程中所选择的策略形成的不同局势以及策略的均衡. 在经典的博弈论理论中,将博弈分为不完全信息博弈和完全信息博弈. 不完全信息博弈是指在不充分了解其他参与人的特征、策略空间以及收益函数的情况下的博弈.
1965年,Zadeh发表的《模糊集理论》[1]为之后的模糊数学研究提供了系统的理论基础. 现如今模糊集理论已经应用到不动点理论、变分不等式和博弈论等许多领域[2-4].
1982年,波兰数学家Pawlak创立了粗糙集理论[5],作为刻画不完整性和不确定性的数学工具,能有效地分析不精确、不一致、不完整等各种不完备的信息,还可以对数据进行分析和推理,从中发现隐含的知识,揭示潜在的规律. 因此,粗糙集理论被广泛使用在机器学习、数据挖掘、图像处理、模式识别等许多领域. 国内外针对模糊不完全信息的单独博弈大都基于模糊集理论[6-9]. 目前利用粗糙集理论来解决博弈论中不确定性问题的研究相对较少[10-14]. 文献[14]在文献[11]的基础上进一步分析不完全信息博弈的粗糙均衡并讨论了不完全信息古诺博弈的粗糙均衡. 本文在以上研究的基础上给出了不完全信息博弈的粗糙均衡的存在性定理并对n人古诺博弈的粗糙均衡进行了讨论.
全文HTML
-
设U是论域,R是一等价关系,则(U,R)称为近似空间. 设X是U的子集,x∈X⊂U,则[x]R表示根据等价关系R构成的不可分辨元素的集合,为R-元素集,所有等价类集合记为ind(R). 用U中所有具有属性R的元素的集合来表达X时,则有的元素一定属于X,而有的元素不一定属于X. 当给定近似空间(U,R),对于每一个子集X和一个等价关系R,可根据R的基本集合的描述来划分集合X,从而得出下近似和上近似的定义.
定义1[5] 设X⊂U,R是一个等价关系,那么当X可以由ind(R)中的集合的并表示时,则X是R可定义的,否则,X是R不可定义的.
定义2[5] 若集合R-(X)={x丨x∈U,[x]R⊂X },则称R-(X)是X(X⊂U)的R-下近似集.
定义3[5] 若R-(X)={x丨x∈U,[x]R∩X≠Ø},则称集合R-(X)是X(X⊂U)的R-上近似集.
定义4[5] 令R-(X)={x丨x∈U,[x]R⊂X}为下近似集,R-(X)={x丨x∈U,[x]R∩X≠Ø}为上近似集. 如果R-(X)=R-(X),则称X关于近似空间(U,R)是可定义的,否则称X关于近似空间(U,R)是粗糙的,简称为粗糙集.
下近似表示根据等价分类R判断一些元素(具有不可分辨性)组成的集合一定属于X,即[x]R中的元素根据等价分类R一定属于X. 上近似表示通过R,一些元素组成的集合与X的交集非空,即根据R其中有的元素可能属于X,有的元素可能不属于X. 上近似集和下近似集之差被称为X的R-边界集,记为BNR(X)=R-(X)-R-(X). 由于存在边界区域,集合中的某些元素既不能在全域的某个子集上被分类,也不能在它的补集上被分类,这就产生了不确定性. 集合的边界区域越大,则精确度越低.
定义5[11] 集合X的近似精确度:设R-(X)和R-(X)分别是集合X(X⊂U)的R-下近似集和R-上近似集,称dR(X)=
$\frac{{\left| {{R_ - }(X)} \right|}}{{\left| {{R^ - }(X)} \right|}}$ 为集合X的R-近似精度,其中· 表示基数,即集合元素的个数. 若R-(X)≠Ø,则定义dR(X)=1,此时信息是完备的. 本文证明需要用到以下几个定理.定理1[15] x*∈X是非合作博弈的Nash平衡点的充分必要条件为x*∈X是最佳回应映射F:X→P0(X)的不动点.
定理2[15] (Berge极大值定理)如果f:X×Y→
${\mathbb{R}}$ 是连续的,G:Y→P0(Y)在Y上是连续的,且∀y∈Y,G(y)是非空紧集,则V(y)在Y上必是连续的,且∀y∈Y,由M(y)= x∈G(y):f(x,y)=V(y) 定义的集值映射M:Y→P0(X)在Y上必是上半连续的.定理3[16] (Kakutani-Fan-Glicksberg不动点定理)设X是一个局部凸Hausdorff拓扑向量空间的一个空紧凸集,令φ:X→2X是X上的一个集值映射,φ上半连续且对于所有x∈X,φ(x)是非空闭凸的,则φ有一个不动点x0∈X,使得x0∈φ(x0).
-
下面先给出文献[17]中经典的n人静态贝叶斯博弈模型. 记-i=N\{i}为除了局中人i以外其他n-1个局中人.
模型(A)[17] 设N={1,…,n}为局中人集合,∀i∈N,局中人的类型为集合Θi= θ1(i),…,θm(i). 局中人i的类型上的概率分布(先验知识)为Pi. Xi= x1(i),…,xl(i)为局中人i的策略集. ui:X×Θ→
${\mathbb{R}}$ 是局中人i的收益函数,其中$X = \prod\limits_{i = 1}^n {{X_i}} , \mathit{\Theta } = \prod\limits_{i = 1}^n {{\mathit{\Theta }_i}} $ . 条件概率pi=pi(θj(-i)丨θj(i)),i∈{1,…,n},j∈{1,…,m}表示局中人i在决定自己的类型为θj(i)的情况下,局中人i对其他局中人类型θj(-i)∈Θ-i=∏s∈N\{i}Θs的不确定性. 用Γ={Θ1,…,Θn;X1,…,Xn;p1,…,pn;u1,…,un}表示此博弈.古诺双寡头竞争经济模型是不完全信息博弈的一个经典例子. 在古诺双寡头竞争经济模型中,假设企业不知道其它企业是低成本还是高成本的,但是假定一个企业知道其他企业类型的概率分布. 为了更贴近现实情况,假设Pi是不容易得到的,因此,在这种情况下,贝叶斯博弈模型不再是合适的分析工具. 粗糙集理论是建立在分类机制的基础上的,它将分类理解为在特定空间上的等价关系,而等价关系构成了对该空间的划分. 基于粗糙集对于信息的分类作用并根据已知信息便能够推断出局中人类型(或是属性)上的近似精确度. 例如可以从公司的财务报表知道成本、盈利等信息,并根据这些信息推断出这个公司是成本低还是高)和是否是盈利型的. 建立博弈模型如下:
模型(B) 设N={1,…,n}为局中人集合. 设∀i∈N,Yi={y1(i),…,yn(i)}为局中人i的信息集,Y-i={y1(-i),…,yl(-i)},局中人i根据Y-i中的知识对其他的n-1位局中人进行分类. Θi={θ1(i),…,θm(i)}为局中人i的类型集,Θ-i={θ1(-i),…,θl(-i)}. Xi是局中人i的策略集. ui:X×Θ→
${\mathbb{R}}$ 是局中人i的收益函数. 定义局中人i对于局中人-i的类型判断映射gi:Y-i→Θ-i. 局中人i确定局中人-i属于类型θj(-i)的近似精确度为di(Y-i)=$\frac{{\left| {{g_{{i_ - }}}\left( {{Y_{ - i}}} \right)} \right|}}{{\left| {g_i^ - \left( {{Y_{ - i}}} \right)} \right|}}$ ,0≤di(Y-i)≤1. 当di(Y-i)=1时为完备信息博弈. 由文献[11]可知,局中人i的类型变化计算出的近似精确度之和为1. 用G={X1,…,Xn;Θ1,…,Θn;d1,…,dn;u1,…,un;Y1,…,Yn;}表示此博弈. 设局中人i的粗糙期望效用函数为定义6 若存在策略组合x*∈X满足
则称x*是博弈G的一个粗糙Nash均衡,
定理4[15] i∈N,设Xi是局部凸Hausdorff拓扑线性空间中的非空凸紧集,ui:X→
${\mathbb{R}}$ 连续,且∀x-i∈X-i,xi→ui(xi,x-i)在Xi上是拟凹的,则此对策的Nash平衡点必存在.定理5 设G={X1,…,Xn;Θ1,…,Θn;d1,…,dn;u1,…,un;Y1,…,Yn }是一个满足以下条件的粗糙非合作博弈:设∀i∈N
(ⅰ) Xi是局部凸Hausdorff拓扑线性空间中的非空凸紧集,
(ⅱ) ui:X×Θ→
${\mathbb{R}}$ 连续,(ⅲ) ∀x-i∈X-i,xi→ui(xi,x-i;θj(i),θj(-i))在Xi上是拟凹的,
(ⅳ) 令
${f_i} = \sum\limits_{{x_{ - i}}} {{d_i}} \left( {{Y_{ - i}}} \right){u_i}\left( {{x_i}, {x_{ - i}};\theta _j^{(i)}, \theta _j^{( - i)}} \right)$ ,则G有一个Nash均衡.
证 首先,
$X = \prod\limits_{i = 1}^n {{X_i}} $ 必是局部凸Hausdorff拓扑线性空间中的非空凸紧集,其中,∀i∈N,∀x-i∈X-i=∏s∈N\{i}Xs. 令由于ui连续,则显然fi连续,且对于任意x-i,xi→fi(xi,x-i;θj(i),θj(-i))是连续的,又Xi是局部凸Hausdorff拓扑线性空间中的非空凸紧集,可知Xi是闭集. 记
则wim∈Xi,因Xi是闭集,wi∈Xi. 又fi(wim,x-i)=c,因fi连续,故fi(wi,x-i)=c,wi∈Fi(x-i),Fi(x-i)必是闭集. 又wi1,wi2∈Fi(x-i),∀ε∈(0,1),因wi1,wi2∈Xi且Xi是闭集,故εwi1+(1-ε)wi2∈Xi,f(εwi1+(1-ε)wi2,x-i)≤c,又fi(wi1,x-i)=fi(wi2,x-i)=c,∀x-i∈X-i,xi ui(xi,x-i;θj(i),θj(-i))在Xi上是拟凹的,故xi→fi(xi,x-i;θj(i),θj(-i))在Xi上是拟凹的,则f(εwi1+(1-ε)wi2,x-i)≥min{fi(wi1,x-i),fi(wi2,x-i)}=c. 故f(εwi1+(1-ε)wi2,x-i)=c,εwi1+(1-ε)wi2∈Fi(x-i),Fi(x-i)必是凸集. ∀i∈N,Fi(x-i)是非空闭凸集,因此
$F(x) = \prod\limits_{i = 1}^n {{F_i}} \left( {{x_{ - i}}} \right)$ 必是非空闭凸集. ∀i∈N,因fi(xi,x-i;θj(i),θj(-i))连续,而Xi是闭集,由定理2,集值映射Fi:X-i→p0(Xi)必是上半连续的. 因此$F(x) = \prod\limits_{i = 1}^n {{F_i}} \left( {{x_{ - i}}} \right)$ 在X上必是上半连续的,由定理3知存在x*∈X,使x*∈F(x*). 最后由定理1知x*必是G的Nash均衡点.推论1 当di(Y-i)=1时,定理5与Nash均衡定理4是等价的,此时为完全信息静态博弈.
-
设n个企业生产同一产品,用ciH表示企业i是高成本,ciL表示企业i是低成本,其中i∈{1,…,n}. 集合Ti={ciH,ciL}为企业i的类型集. 销售价格为P(Q)=a-Q,Q=q1+…+qn为市场产品总量. 将每个企业的单位成本记为ci. 企业i的净收益函数为Ci=qi(a-Q-ci). 对于每个企业所属类型的概率分布是未知的,设有限集Xi={x1,…,xn}为企业i的信息集. 设定判断机制(等价分类关系),即Ri:xi→{ciH,ciL}. 因为企业i是知道自己的类型的,故只需对其他n-1个企业的类型做出近似判断. 企业i首先对企业j的类型作判断. 此时固定其他n-2个企业的类型,为了便于分析,可假设其他n-2个企业的类型同时为低成本或高成本. 假设企业j根据判断Rj被判定为高成本的元素有m个,即高成本下近似集的基数为m,此时等价关系为cjH,故下近似集可记为丨Ri_(c2H)丨=m,Xj的上近似集为其自身,基数为n,记为丨Ri-(cjH)丨=n,则企业i认为企业j是高成本的近似精度为
${d_i}\left( {c_j^H} \right) = \frac{{\left| {{R_{{i_ - }}}\left( {c_j^H} \right)} \right|}}{{\left| {R_i^ - \left( {c_j^H} \right)} \right|}} = \frac{m}{n}$ . 又设低成本的元素有l个,也就是低成本下近似集的基数为l,此时等价关系为cjL,故下近似集可记为丨Ri_(cjL)丨=l,则企业i认为企业j是低成本的近似精度为${d_i}\left( {c_j^L} \right) = \frac{{\left| {{R_{{i_ - }}}\left( {c_j^L} \right)} \right|}}{{\left| {R_i^ - \left( {c_j^L} \right)} \right|}} = \frac{l}{n}$ ,且di(cjH)+di(cjL)=1. 企业i的粗糙期望效益为根据前面的假设,其他n-2个企业的类型同时为低成本时(因为为低成本和高成本的分析方法和过程是一样的),令
${f_i} = \frac{m}{n}{q_i}\left( {a - {c_i} - q_j^H - {\Delta ^L}} \right) + \frac{l}{n}{q_i}\left( {a - {c_i} - q_j^L - {\Delta ^L}} \right)$ ,其中企业i会选择使得粗糙期望效用函数最大化的产量,设为qi*,即qi*∈
${\mathop{\rm argmax}\nolimits} \left\{ {{f_i} = \frac{m}{n}{q_i}\left( {a - {c_i} - q_j^H - {\Delta ^L}} \right) + \frac{l}{n}{q_i}\left( {a - {c_i} - q_j^L - {\Delta ^L}} \right)} \right\}$ .令
$\frac{m}{n}{q_i}\left( {a - {c_i} - q_j^H - {\Delta ^L}} \right) + \frac{l}{n}{q_i}\left( {a - {c_i} - q_j^L - {\Delta ^L}} \right) = 0$ ,对qi求一阶导数得$q_i^* = \frac{1}{2}\left( {a - {c_i} - \frac{m}{n}q_j^H - } \right.\left. {\frac{l}{n}q_j^L - {\Delta ^L}} \right)$ .当企业i是低成本时有
当企业i是高成本时有
同时,企业j在做决策时也会考虑其他人的类型,讨论企业j对企业i类型所做的判断. 设根据判断Xi={x1,…,xn}里企业i为高成本的元素有k个,也就是高成本下近似集的基数为k,此时等价关系为cjH,故有
$\left| {{R_{{i_ - }}}\left( {c_i^H} \right)} \right| = k, \left| {R_i^ - \left( {c_i^H} \right)} \right| = n$ ,故企业j认为企业i是高成本的近似精度为${d_j}\left( {c_i^H} \right) = \frac{{\left| {{R_{{i_ - }}}\left( {c_i^H} \right)} \right|}}{{\left| {R_i^ - \left( {c_i^H} \right)} \right|}} = \frac{k}{n}$ . 又设为低成本的元素有h个,故有$\left| {{R_{{i_ - }}}\left( {c_i^L} \right)} \right| = h, \left| {R_i^ - \left( {c_i^L} \right)} \right| = n$ ,故企业j认为企业i是低成本的近似精度为${d_j}\left( {c_i^L} \right) = \frac{{\left| {{R_{{i_ - }}}\left( {c_i^L} \right)} \right|}}{{\left| {R_i^ - \left( {c_i^L} \right)} \right|}} = \frac{l}{n}$ ,且${d_j}\left( {c_i^H} \right) + {d_j}\left( {c_i^L} \right) = 1$ . 同理,当企业j是低成本时有当企业j是高成本时有
因为企业i对其他n-2个企业的分析过程和对企业j的类似. 故用相同的方法可以求出其他n-2个企业的最优产量qgL*,qgH*,g≠i,j. 故当每个企业都选择最优产量时,所构成的产量组合就为粗糙Nash均衡. 因为每个企业有两种类型,故共有2n种均衡组合.
值得注意的是,本文中仅讨论了固定其他n-2个企业都是低成本的情况,当然也可以假设其他n-2个企业的类型不相同或都为高成本,这正好符合现实经济的复杂性和变动性.
-
本文研究了基于粗糙集上的不完全信息非合作博弈. 证明了粗糙Nash均衡的存在定理. 模型(B)是对模型(A)的一种扩展,极大地保留了原始信息的客观性,具有更强的实用性和理论价值. 本文仅研究了模型(B)的均衡解存在性问题,对于其均衡解的稳定性研究将是下一步的工作.