基于复值神经网络的分式规划问题

张雷; 王利敏; 李小兵

doi:10.13718/j.cnki.xsxb.2019.05.001

摘要: 研究了利用复数神经网络解决带有区间约束条件的复变量非线性分式规划问题，提出的神经网络模型关于问题的可行解具有全局稳定性.对模型平衡点的存在性和稳定性给出了详细推导和证明.最后通过数值例子证实了该模型的可靠性和有效性.

Abstract: The solution of complex nonlinear fractional programming problem with interval constraints has been studied in this paper by means of the complex neural network, feasible solutions about the problem of global stability of the equilibrium have been proposed with the neural network model, and points for the existence and stability have been deduced and proved. Finally, a numerical example is given to demonstrate the reliability and effectiveness of the proposed model.

Key words:

全文HTML

文献[1]将神经网络应用于求解线性规划问题和旅行商问题；文献[2]引入了非线性规划电路，并利用有限的阀参数来解决非线性规划问题；随后文献[3]提出了基于拉格朗日方法的拉格朗日网络用于求解二次规划问题.但上述模型都是实空间上的，在实际问题中很多问题都涉及到复数信号^[4-7].近年来，复空间上的分式规划问题得到了广泛研究^[8-9].复数神经网络可以直接处理复数信号，目前神经动态优化算法主要是利用实数神经网络模型对实空间上的优化问题进行求解，很少有人利用复数神经网络模型研究复空间上的优化问题^[10-11].

本文中复数神经网络神经元的状态、输出以及网络的权值都是复数，它能直接处理复数数据.复数域不仅提供了一种简明的表示方法，而且能够保持原始问题的物理特征.同时，将带有区间约束的约束条件通过变量替换和坐标平移转化为复平面上以原点为中心的圆环区域或矩形环区域，从而简化了约束条件，方便了之后的讨论.因此，直接利用复数解决问题的方法更优.

1. 模型的建立

本文构造一个复数域上的RNN(recurrent neural network)模型，此模型同时适用于线性分式规划和非线性分式规划.现在讨论一般的复数非线性分式规划问题：

其中：g(z)，h(z)是定义在一个开凸集O⊆$\mathbb{C}$ⁿ上的连续可微函数；x=Re(z)∈$\mathbb{R}$ⁿ；y=Im(z)∈$\mathbb{R}$ⁿ；a，b，c，d∈$\mathbb{R}$ⁿ是常向量；可行解约束在W={z|a≤x≤b，c≤y≤d}中；z=(z₁，z₂，…，z_n)^T∈$\mathbb{C}$ⁿ是决策向量即自变量.约定目标函数中的g(z)>0.实际生活中出现的分式规划问题大都具有广义凸性，目标函数F(z)在O处是伪凸的.

考虑如下的一元递归神经网络，其状态变量z用以下微分方程表示^[12]：

其中：▽是梯度算子，投影算子$ f_{\mathrm{W}} : \mathbb{C}^{n} \longmapsto W$定义为$f_{\mathrm{w}}=\arg \min\limits _{\omega \in W}\| \mathit{\boldsymbol{z}}-\omega\|^{2}$.令$ \mathit{\boldsymbol{z}}= \mathit{\boldsymbol{x}}+{\rm i} \mathit{\boldsymbol{y}}, {\rm i}=\sqrt{-1}$代表虚数单位，F(z)可以看作是由其实部和虚部组成的二变量实函数.由此，定义以下辅助函数，f(x，y)：$\mathbb{R}^{n} \times \mathbb{R}^{n} \longmapsto \mathbb{R}^{n}$，其中：f(x，y)=F(z)，z=x+iy.

对于给定的w=(Re(z^T)，Im(z^T))^T，定义映射φ(z)，且φ是可逆的，将z=φ^－1(w)代入g(z)，得到f(w)=F(φ^－1(w))：$\mathbb{R}^{2 n} \longmapsto \mathbb{R}^{n}$.

由$ \mathit{\boldsymbol{x}}=\frac{( \mathit{\boldsymbol{z}} +\overline{ \mathit{\boldsymbol{z}}})}{2}, y=-{\rm i} \frac{( \mathit{\boldsymbol{z}}-\overline{ \mathit{\boldsymbol{z}}})}{2}$，可以得到F(z)=F(z，z)：$\mathbb{C}^{n} \times \mathbb{C}^{n} \longmapsto \mathbb{R}^{n}$，其中z是z的复共轭.假设f(x，y)的偏导数$\frac{\partial f}{\partial \mathit{\boldsymbol{x}}}, \frac{\partial f}{\partial \mathit{\boldsymbol{y}}}$存在，则对复变量z和z的偏导数定义为如下形式：

假设F(z)关于z和z是可微的，F(z)的复梯度定义为如下形式^[13]：

由可行解集W的区间约束，算子f_W可明确地表达为如下的形式：f_W(z)=(f_W₁(z)，…，f_{W_n}(z))，其中第i个分量是f_{W_i}(z_i)=f_{_RWi}(x_i)+if_{IW_i}(y_i).

又由$ \mathit{\boldsymbol{z}}-\nabla F( \mathit{\boldsymbol{z}})= \mathit{\boldsymbol{x}}+{\rm i} \mathit{\boldsymbol{y}}-\frac{\partial f}{\partial \mathit{\boldsymbol{x}}} -\mathrm{i} \frac{\partial f}{\partial \mathit{\boldsymbol{y}}}=\left(x-\frac{\partial f}{\partial \mathit{\boldsymbol{x}}}\right)+\mathrm{i}\left( \mathit{\boldsymbol{y}}-\frac{\partial f}{\partial \mathit{\boldsymbol{y}}}\right)$，从而模型转化成如下形式

即

记u=(Re(z^T)，Im(z^T))^T=(x^T，y^T)^T∈$\mathbb{R}^{2 n}, \nabla F(\boldsymbol{u})=\left(\frac{\partial f}{\partial \mathit{\boldsymbol{x}}}, \frac{\partial f}{\partial \boldsymbol{y}}\right)$，则

模型(2)以n维复向量作为自变量，将复向量转化成2n维的实向量，从而实现了从复数神经网络模型向实数神经网络模型的转化.区间约束条件由原来的W={z|a≤x≤b，c≤y≤d}转化为W′={u|a_i≤ u_i≤b_i，c_j≤u_j≤d_j，i =1，2，…，n，j =n+1，n+2，…，2n}.

将RNN模型(7)应用于解决优化问题(1)时，要求初始状态应该能够被映射到W上，即对任意的u⁰=(x₁⁰，x₂⁰，…，x_n⁰，y₁⁰，y₂⁰，…，y_n⁰)∈$\mathbb{R}^{2 n}$，相应的神经网络轨迹初始点应为u(0)=f_W(u⁰). RNN模型(7)的平衡状态解集Ω^e定义如下：

在这里，通过w=(Re(z)，Im(z))和v=(z，z)$\stackrel{\varDelta}{=} \varphi( \mathit{\boldsymbol{z}}) \in \mathbb{C}^{2 n}$建立了复数与实数之间的转换.

2. 模型的稳定性

定义1   设u(t)是系统$\dot{ \mathit{\boldsymbol{u}}}$=F(u)的一个解，如果当t→∞每一个开始于W′上的解u(t)满足

则系统关于W′在U上是一致收敛的.其中ρ(u(t)，U)=$\inf\limits_ {a ∈U} $‖u－a‖，u(0)=u₀∈W′.

定义2   如果神经网络模型(7)相应的动力学系统是一致收敛的，则神经网络模型关于W′在U上是一致收敛的.

引理1^[14]   对任意给定的初始点u(0；u⁰)=u⁰∈W′，模型(7)的解u(t；u⁰)是有界的，且这个解可以延伸到∞时间.

引理2^[14]   对任意v∈ $\mathbb{R}^{2 n}$，u∈W′，有(v－f_W(v))^T(f_W(v)－u)≥0.

美国数学家LaSalle发现Lyapunov函数与Birkoff极限集之间的内在联系而提出了著名的不变原理.考虑自治系统

其中函数f(x)∈ $\mathbb{C}\left(\mathbb{R}^{n}, \mathbb{R}^{n}\right)$，f(0)=0.

引理3 (LaSalle不变原理)^[15]   设$D \subseteq \mathbb{R}^{n}$是一个紧集，从D内出发的解x=φ(t；0，x₀)恒在D中，若存在$\boldsymbol{V}(\boldsymbol{x}) \in C(D, \mathbb{R})$，使得$\left.\frac{{\rm d} \mathit{\boldsymbol{V}}}{{\rm d} t}\right|_{(10)} \leqslant 0$，又设$E=\left\{ \mathit{\boldsymbol{x}}\left|\frac{\mathrm{d} \boldsymbol{V}}{\mathrm{d} t}\right|_{(10)}=0, x \in D\right\}$，M⊆E是最大不变集，则当t→∞时，有φ(t；0，x₀)→M.

定理1   对于神经网络系统(7)，有以下两个性质成立：

(a) 集合W′是正不变的；

(b) 若u₀∉W′，则u(t)在有限时间内会进入集合W′，并从此保持在集合W′内，或当t→∞时，ρ(t)=dist(u(t)，W′)→0成立，其中dist(u(t)，W′)=$\inf\limits_ {a ∈W′} $‖u－a‖.

证   为了方便证明，以下自变量和函数值均表示成向量的分量形式.

记

首先证明对任意u_i⁰=u_i(0；u⁰)∈Wⁱ，它在以后的任意时间内对每一个分量都有u_i(t)=u_i(t；u⁰)∈Wⁱ成立.即对所有的t≥0，u_i(t)∈Wⁱ.

记

即t^*表示u_i(t)∈Wⁱ的最晚时间，在t^*之后至少存在一个t′使u′_i(t′)∉Wⁱ.所以要证明以上结论，只需证明${\tilde{t}}$=+∞，这就意味着u_i(t)∈Wⁱ永远成立.

接下来使用反证法证明${\tilde{t}}$ =+∞.假设${\tilde{t}}$＜∞，则当t∈[0，t^*]时u_i(t)∈Wⁱ，当t∈(t^*，t^*+δ)时u_i(t′)∉Wⁱ，其中δ>0.不失一般性，不妨假设

由f_{W_i}的定义及模型(7)和(13)式，可以得到

所以，u_i(t)在t∈(t^*，t^*+δ)上都是严格单调递增的，因此

记当t∈[0，t^*]时有u_i(t)∈W′，又由(13)式知u_i(t_i^*)=a_i，所以由(15)式可以得到

由此得到矛盾.所以t_i^*=+∞，即对所有的t≥0，u_i(t)∈Wⁱ.这说明集合W′是正不变的，(a)得到保证.至于对u_i(t) <c_i，u_i(t)>b_i和u_i(t)>d_i情况的证明类似于u_i(t) <a_i.在此不再赘述.

接下来证明若u_i⁰=u_i(0；u⁰)∉Wⁱ，u_i(t)最终也会收敛到W′中.

对于i，假设u_i⁰=u_i(0；u⁰)∉Wⁱ，如果存在一个t_i^*>0使得u(t_i^*)∈Wⁱ，则根据(a)，当t≥t_i^*时总有u(t_i^*)∈Wⁱ成立.现用反证法证明.

假设对所有的t≥0，u_i(t)∉Wⁱ.不失一般性，假设u_i(t)<a_i，则sup{u_i(t)|t≥0}=a_i.若不然，假设sup{u_i(t)|t≥0}=m<a_i，由模型(7)得到

从而

这与u_i(t)<a_i矛盾.因此sup{u_i(t)|t≥0}=a_i.

以上证明说明：若u₀∉W′，则z(t)在有限时间内会进入集合W′，并从此保持在W′内，或当t→∞时，ρ(t)=dist(u(t)，W′)→0成立，其中dist(u(t)，W′)=$\inf\limits_{ a ∈W′}$ ‖u－a‖.

定理2   神经网络模型(7)的解集Ω^*关于W′是一致收敛的.

证   由引理2，可得

令v=u－▽F(u)，u=u，则

定义能量函数F(u)，关于(7)式提出的z(t)=x(t)+iy(t)中的x(t)对函数进行微分计算，得到

根据(19)式进而得到

表明F(u)沿着系统(7)的轨线是单调递减的，u(t)是有界的，所以F(u)是系统(7)的Liapunov函数.

因此，由LaSalle正不变规则，所有开始于W′的系统(7)的轨线都将收敛到E的最大正不变子集Σ中，其中

由(22)式可知$\frac{\mathrm{d} F}{\mathrm{d} t}=0$当且仅当f_W(u－▽F(u))－u=0，这说明u(t)是模型(7)的平衡点或者说u(t)∈Ω，这里Ω=Ω^*是神经网络模型(7)开始于W′的所有轨线的收敛集，从而定理2得证.

4. 结论

本文针对带有区间约束的复变量非线性分式规划问题，提出了一个复数神经网络模型，通过证明可行解的收敛性证明了神经网络模型的稳定性.现有的基于罚函数的神经网络模型在解决非线性分式规划问题时可能会出现找不到精确解的情况，而本文提出的模型克服了这一缺陷.

参考文献 (15)

姓名
	姓名不能为空！
邮箱
	邮箱不能为空！非法的邮箱地址。
手机号码
	电话不能为空！请输入有效手机号!
标题
	标题不能为空！
留言内容
	内容不能为空！
验证码
	验证码不能为空！验证码错误！

[1]	HOPFIELD J, TANK D.Computing with Neural Circuits:a Model[J].Science, 1986, 233(4764):625-633. doi: 10.1126/science.3755256
[2]	KENNEDY M P, CHUA L O.Neural Networks for Nonlinear Programming[J].IEEE Transactions on Circuits and Systems, 1988, 35(5):554-562. doi: 10.1109/31.1783
[3]	ZHANG S.Lagrange Programming Neural Networks[J].IEEE Transactions on Circuits and System Ⅱ, Analog Digital Signal Process, 1992, 39(7):441-452. doi: 10.1109/82.160169
[4]	LEVINSON N.Linear Programming in Complex Space[J].Journal of Mathematical Analysis and Applications, 1966, 14(1):44-62. doi: 10.1016/0022-247X(66)90061-8
[5]	SWARUP K, SHARMA I C.Programming with Linear Fractional Functionals in Complex Space[J].Cahiers du Centre d-Etudes Recherche Opér, 1970, 12:103-109.
[6]	FERRERO O.On Nonlinear Programming in Complex Space[J].Journal of Mathematical Analysis and Applications, 1992, 164:399-416. doi: 10.1016/0022-247X(92)90123-U
[7]	doi: http://cn.bing.com/academic/profile?id=33d230b782737c9abe4497722498bfdf&encoded=0&v=paper_preview&mkt=zh-cn BRANDWOOD D H.A Complex Gradient Operator and Its Application in Adaptive Array Theory[J].IEEE Proceedings onCommunications, Radar and Signal Processing, 2008, 130(1):11-16.
[8]	LAI H C, HUANG T Y.Optimality Conditions for a Nondifferentiable Minimax Programming in Complex Spaces[J].Nonlinear Analysis, 2009, 71(3-4):1205-1212. doi: 10.1016/j.na.2008.11.053
[9]	焦合华.一类极大极小分式规划的最优性和对偶[J].西南大学学报(自然科学版), 2014, 36(9):75-80. doi: http://d.old.wanfangdata.com.cn/Periodical/xnnydxxb201409012
[10]	汤干文.具有脉冲和变时滞的离散Cohen-Grossberg神经网络的全局指数同步[J].西南师范大学学报(自然科学版), 2013, 38(12):43-49. doi: http://xbgjxt.swu.edu.cn/jsuns/jscnuhhse/ch/reader/view_abstract.aspx?file_no=X2013-12-043&flag=1
[11]	doi: http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=0e05acda9d229ca5abbc239aee9ff66e ZHANG L, SONG Q K, ZHAO Z J.Stability Analysis of Fractional-Order Complex-Valued Neural Networks with Both Leakage and Discrete Delays[J].Applied Mathematics and Computation, 2017, 298:296-309.
[12]	doi: http://d.old.wanfangdata.com.cn/OAPaper/oai_doaj-articles_54085d039cb85d4d19a439e4077bc192 ZHANG Q J, LU X Q.A Recurrent Neural Network for Nonlinear Fractional Programming[J].Mathematical Problems in Engineering, 2012, 2012:589-597.
[13]	ZHANG S, XIA Y, WANG J.Analysis of a Complex-Valued Projection Neural Network for Constrained Optimization of Real Functions in Complex Variables[J].IEEE Transactions on Neural Networks and Learning Systems, 2015, 26(12):3227-3238. doi: 10.1109/TNNLS.2015.2441697
[14]	KINDERLEHRER D, STAMPACCHIA G.An Introduction to Variational Inequalities and Their Applications[M]. New York:Academic Press, 1980.
[15]	刘碧森, 王晓梅, 范小明, 等.神经网络定性理论[M].北京:科学出版社, 2008.

留言板