SDN中一种多控制器负载均衡方案

马勤; 李志芳

doi:10.13718/j.cnki.xsxb.2021.07.016

摘要: 针对软件定义网络(software defined network，SDN)中控制器子域分区不合理导致的控制器负载分配不平衡、网络通信性能下降的问题，本文提出一种基于负载均衡的多控制器部署(multi-controller load balancing，MLB)方案. 在初始静态网络中，提出一种基于域内和域间通信成本的负载平衡控制器部署模型，并将流量请求转换为排队模型. MLB将近邻传播(affinity propagation，AP)算法中的偏置参数和阻尼系数这两个参数作为粒子，通过粒子群优化(particle swarm optimization，PSO)算法对其进行智能调整，解决集群性能受偏置参数和阻尼系数初始值影响的问题，得到合理的网络规划. 实验结果表明：与亲缘传播算法和遗传算法(genetic algorithm，GA)相比，该方案可以提供更稳定、准确和负载均衡的多控制器部署.

Abstract: Aiming the problem of unbalanced controller loads distribution and network communication performance degradation caused by unreasonable subdomain partitioning of controllers in software defined network (SDN), a multi-controller load balancing scheme is proposed. In the initial static network, a load balancing controller deployment model based on the intra-domain and inter-domain communication cost has been proposed, and the traffic requests are transformed into a queuing model. MLB takes the two parameters that bias parameters and convergence coefficients in affinity propagation algorithm as particles, then adjusts it intelligently by particle swarm optimization(PSO) algorithm, to solve the problem of clustering performance being affected by the initial values of the bias parameters and convergence coefficients, getting the reasonable network planning. Experimental results show that compared with affinity propagation algorithm and genetic algorithm, this scheme can provide more stable, accurate and load balancing multi-controller deployment.

Key words:

全文HTML

软件定义网络(SDN)是一种新颖的网络体系结构，它将控制平面和数据转发平面分开^[1]，通过应用程序接口和开放程序接口控制网络流量，为研究新的网络应用程序和未来的Internet技术提供一种新的解决方案^[2].

随着Internet流量和规模的爆炸性增长，尤其是当网络设备广泛分布在各个区域时，单个控制器可以支持的网络规模受到限制^[3]. 为了避免由于单个控制器负担过重而导致网络性能低下和单点故障问题，通常在网络中部署多个控制器来实现分布式控制管理^[4]. 多控制器将控制平面分为几个子域，每个控制器只需要管理自己的域中交换机，因此可以减轻控制平面在可靠性、可扩展性和多功能方面的不足. Zhao等^[5]提出一种基于亲缘传播的改进聚类算法，与传统的聚类算法相比，该算法可以获得更好的网络性能. Liu等^[6]提出控制器负载均衡算法，考虑了交换机与控制器之间的平均延时和最差延时，并通过优化模型解决了控制器和交换机之间的部署问题. Zhang等^[7]提出一种基于K-Critical算法的最小控制器数量和部署计划方法. 张栋等^[8]引入一种k-means算法来部署软件定义网络(SDN)控制器，该算法开始时仅在一个区域上运行，然后通过增加分区数进行迭代. Wang等^[9]引入粒子群优化(PSO)来解决SDN的控制器部署问题，优化目标是使控制器和交换机之间的传播延迟最小，还考虑了控制器的容量限制. Singh等^[10]提出一种网络聚类PSO算法，该算法考虑了控制器的负载和传播延迟. Liao等^[11]研究了SDN的弹性，并将控制器和交换机之间连接的弹性作为性能评估指标. 在此基础上，定义了网络弹性优化的控制器部署问题，并提出了相应的启发式算法来寻找控制器的最优位置. 为了提高SDN的生存能力，killi等^[12]提出一种控制器放置策略，该策略考虑了网络设计时的路径多样性，控制器容量以及故障转移机制. Li等^[13]介绍了SDN可靠性的度量，并给出了基于紧密中心的控制器部署.

当前在控制器部署中考虑的主要因素是延迟和稳定性，控制器容量和控制器之间的负载均衡也是非常重要的因素. 本文提出一种多控制器负载均衡算法(MLB). 该算法基于域内和域间通信成本建立负载平衡控制器部署模型，并将流量请求转换为排队模型. 初始的静态网络中可以预先设置控制器部署问题，将近邻传播(AP)算法中的偏置参数和阻尼系数作为粒子，通过PSO算法对其进行智能调整. 该算法提高了聚类效果和收敛精度，实现了平衡的控制器部署.

1. 研究背景

1.1. 网络模型

基于图论建立了多控制器SDN模型. 带内通信通常被用作SDN中的主要通信模式. 在本文中，控制器网络拓扑由无向图G=(V，E)表示，其中V和E分别是节点和链接的集合. M代表网络中控制器的数量，C是控制器集，C={C₁，…，C_M}. N代表交换机的数量，S是交换机组，S={S₁，…，S_N}，故|V|=M+N. λ_i^t是时隙间隔t中第i^th个交换机的请求速率，d_ij表示第i^th个交换机和第j^th个控制器之间的最短距离. x_ij^t是一个二进制变量，并且x_ij^t=1表示交换机i^th在时隙t中已成功连接到j^th控制器. 交换机和控制器之间的部署可以定义为N×M的二进制矩阵Ω. 为了满足动态约束，交换机只能选择一个控制器作为主控制器. 表示为$ x_{i j}^{t}= \begin{cases}1, & \text { 第 } i \text { 个开关连接到第 } j \text { 个控制器 } \\ 0, & \text { 其他 }\end{cases} $. 控制器的处理能力为A，取决于CPU、带宽和内存等因素，A={A₁，…，A_M}. L_M是每个控制器的冗余系数，范围从0到1，这表示控制器具有足够的能力执行状态同步. 流要求j^th控制器需要在时间t内处理与之相连的所有交换机的流量请求总和，表示为$ \mathit{\Phi} _j^t = \sum\limits_{i = 1}^N {\lambda _i^t} x_{ij}^t $，其中每个交换机的λ_i^t不同，表示交换机i^th在时隙t的流请求率. 在OpenFlow网络中，每个接入交换机都会生成流建立请求. 因此，在控制器中流请求的服务时间内，将有多个源自交换机到控制器的“数据包输入”请求. 交换机和控制器之间的流量请求在控制器入口形成队列. 根据OpenFlow交换机向控制器发送请求的特征，可以合理地假设新流建立请求的到达瞬间构成一个速率为Φ_j^t的泊松过程，并且流请求的处理时间独立，具有负指数分布的均值为$ \frac{1}{{{A_j}}} $的相同随机变量. 根据排队论，流量的传输和处理描述为一个M/M/1队列，流请求以排队的形式聚集在所连接的交换机上. 借助利特尔定律，可以获得j^th控制器的平均逗留时间$ \omega _j^t = \frac{1}{{{A_j} - \mathit{\Phi} _j^t}} $. 假设计算单个源路由的时间取决于网络规模，则j^th控制器的平均响应时间可以计算为△t_j=|V|²·ω_j^t，其中|V|代表SDN的节点数，表明处理时间受网络大小的影响. 因此，在时隙t中交换机和控制器之间，控制器的平均响应时间为$ {D^t} = \frac{{\sum\limits_{j = 1}^M {\mathit{\Phi} _j^t} \cdot \Delta {t_j}}}{{\sum\limits_{j = 1}^M {\mathit{\Phi} _j^t} }} $.

(1) 域内通信成本

当需要按需安装流表时，交换机需要将数据包发送到控制器，控制器计算转发路径并将相应的流标签安装到转发路径的交换机. 然后，交换机根据流表转发数据包. 在此过程中，对于控制器C_j，总计流请求路径在时域中的延迟主要包括以下内容：交换机将数据包发送到从属控制器，控制器计算转发路径并安装交换机流表. OpenFlow网络中交换机和控制器之间的通信成本可表示为

式(1)中v_r是轮询交换机的平均速率，它与连接到交换机链路的平均数量有关，v是单位速率，v=1 kb/s.

(2) 域间通信成本

在多控制器环境中，需要控制器之间信息同步，以便每个控制器可以维护全局网络状态信息. 状态同步成本主要指控制器之间交互状态信息所引起的通信成本，如式(2)所示.

式(2)中v_s是控制器状态信息的平均传输速率. 但是v_s小于v_r，因为SDN控制器不会同步所有的信息子域.

基于以上定义和分析，网络总的通信成本表示交换机与控制器之间以及控制器在特定时间的通信成本. 对于给定的网络拓扑，域内通信成本随着控制器数量的增加而降低，而域间通信成本则增加. 总体域内和域间通信成本为

式(3)中γ∈[0, 1]是用于控制交易的加权因子，D_req表示域内通信成本，D_syn表示域间通信成本. 式(4)确保交换机只能选择一个控制器作为主控制器. 式(5)确保控制器的负载在正常范围内，并且不超过控制器的处理能力. 式(6)表示从交换机到控制器的平均延迟小于δ(常数). 式(7)确保每个交换机都可以连接到主控制器. 式(4)-式(7)中N表示变换机数量，M表示控制器数量.

1.2. 问题提出

整个网络包括14个交换机(S1-S14)和4个控制器(C1-C4). 控制器数量和部署位置的差异会导致控制器之间的状态不平衡，并增加分布式网络中的部署成本. 因此，对给定的SDN，本文要解决的问题是获取合理数量的控制器以及交换机与控制器之间的映射关系.

多控制器部署的通信成本包括域内通信和域间通信成本. 控制器的数量越少，域间通信成本就越小，域内通信成本就越大. 为了确保网络性能，交换机和控制器之间的传播延迟不应超过可容忍的阈值. 同时，由于控制器的处理能力和带宽的限制，单个控制器可以处理的切换请求是受限的. 在分配交换机时，应考虑控制器处理请求的能力. 因此，SDN中受流量传播延迟和控制器容量限制的多控制器部署可以描述如下：给定SDN，其交换机和链路的拓扑已知，最终目标是将网络划分为合理的控制域，并以一种最小化整个域内和域间通信成本的方式表示每个域的交换机，这时交换机到控制器的平均延迟不超过可容忍的阈值，并且由单个控制器来管理交换机请求不超过控制器的处理能力. 此外，应尽可能平衡每个控制器的部署.

2. 多控制器负载均衡方案

传统的聚类算法，如k-means算法严重取决于人工干预、影响目标函数的不同初始分区或k值. 因此，本节中建议使用MLB来解决控制器放置问题，无需初始化网络中控制器的数量.

AP算法是一种非常有效的基于分区的聚类算法，该算法将所有数据点视为潜在的聚类中心，采用成对的数据点之间的相似性作为输入数据，并通过在迭代过程中数据点之间传递信息来获得最佳解. 与k-means、模糊C均值和其他聚类算法相比，AP算法具有多个优点，包括效率、对初始化的不敏感性以及用更少的错误来确定范例的能力. 本文提出一种改进的AP算法，即多控制器负载均衡MLB算法来解决SDN中的控制器部署问题. 具体而言，在两个交换机的相似度测量中，采用通信成本λ(t)_id(i，j)x_ij代替欧几里得距离. 通过将算法中的偏置参数和阻尼系数视为粒子，使用PSO算法对其进行智能调整，提高了聚类效果. MLB可以自适应学习最佳控制器的数量，也可以优化交换机和控制器之间的部署关系，从而确保控制器在网络中的合理分配.

为了最小化式(3)中表示的目标函数，将两个节点之间的相似度S(i，j)定义为它们之间的通信，采用通信成本λ(t)_id(i，j)x_ij，而不是标准AP中通常使用的欧几里得距离

当i≠j时，S(i，j)表示将采样点j作为采样点i的代表点的可能性. 对角元素S(i，j)是偏置参数P(j). P(j)的初始值通常取相同的值，这是相似性矩阵中所有非对角元素的最小值或平均值. 它的初始大小对最终聚类数有很大的影响. P值越大，生成的簇越多，反之亦然.

与k-means不同，AP不需要事先知道聚类中心的数量. 责任值R(i，j)和可用性值A(i，j)是AP算法中的两个重要信息. 标准值C(i，j)=R(i，j)+A(i，j)，表示候选节点j作为聚类中心的可能性. 因此，AP聚类在4个矩阵上进行操作：相似性矩阵S，责任矩阵R，可用性矩阵A和标准矩阵C. 考虑到偏置因素和阻尼因子对聚类结果的影响，本文提出一种基于PSO的改进型AP算法MLB. MLB在PSO算法中将偏置因素和阻尼因子作为粒子的位置坐标. 初始化每个粒子的坐标和速度，以选择不同的首选项因素和阻尼因子. 然后根据式(9)、式(10)，粒子的位置和方向会不断更新，在更新过程中将粒子的位置用作AP算法的偏置因素和阻尼因子的值进行聚类.

式(9)中V_id表示第i个粒子在d维上的速度，P_id是粒子经历的最佳位置，P_gd是该组的最佳位置，ω是惯性权重，η₁和η₂是调节P_id和P_gd的重要参数. 式(9)中，将当前粒子位置与单个最优解和群体最优解进行比较，获得群体最优和个体最优的发展趋势，然后根据该趋势和原始初始值确定新的速度方向. 式(10)中粒子的新位置在距向上运动一定距离处产生. X_nd奇数维的值是一个新的偏置元素，偶数维的值是阻尼因子.

当迭代次数超过最大值或集群中心连续数次未更改时，迭代终止.

3. 实验结果与分析

3.1. 模拟环境设置

为了使实验更具代表性，选择OS3E拓扑模型来模拟实验. OS3E拓扑模型由34个节点和42个链接组成. 网络中所有节点都具有部署控制器和交换器的能力，并且它们彼此独立. 算法用JAVA实现，并使用MATLAB分析结果. 交换机的请求速率服从泊松分布，范围为150~550 kb/s. 处理能力A_M设置为15 M. 为了在不同控制器之间产生差异，可以在0.9~1之间任意选择控制器L_M的冗余因子. 对交换机进行轮询的平均速率为v_r=10 kb/s，并且控制器的状态同步信息的传输速率为v_s=1 kb/s.

3.2. 实验结果与分析

为了验证MLB的性能，建立了一系列仿真实验，并将MLB与AP和遗传算法GA进行了比较. 仿真结果表明，本文算法可以提高更加稳定、准确的控制器部署. 为了消除实验的随机误差，3种算法在相同的实验条件下均运行了20次，取平均值作为实验结果.

在OS3E网络中，交换机的数量是一个常数. 将3种算法的T_M参数设置为300次迭代. 目标函数的值随着控制器数量增加而减少，这仅仅是因为随着控制器数量增加，由控制器管理的交换机数量会减少，因此切换到控制器的等待时间也减少. 此外，通过OS3E拓扑更好地处理流量请求所需的控制器数量均为5个，该值确保了这3种算法目标函数的最佳值，而MLB获得了目标函数的最低值.

在相同的控制器部署条件下，GA中每个控制器管理的交换机数量差异最大，其中控制器C1管理的交换机数量是控制器C2和C4的两倍，这是因为遗传算法采用交叉和变异策略使整个集群不断演化并寻找最优解，但是该算法容易陷入最小值. 当节点之间的距离较大时，集群操作很容易陷入局部最优状态，从而导致交换机的区域聚集和较差的子域规划效果. 尽管AP算法不需要设置控制器的数量，但是该算法还会根据交换机之间的距离聚合节点，子域规划的效果不佳. 对实验数据进行归一化后，MLB的节点均衡率为0.87，这明显优于GA(0.66)和AP(0.74).

控制器部署的结果不仅影响网络区域的划分，而且还严重影响控制器的处理延迟和控制流量.

AP算法从控制器的角度优化了子域中的控制流量，但是它不能解决处理延迟差异很大的问题. 而MLB算法将流量请求转化为排队模型，实现了控制流量的均衡分配.

4. 结语

本文讨论了分布式SDN中多控制器的放置问题. 以域内和域间通信成本为优化目标，提出了MLB来解决控制器在初始静态下的放置问题. 实验结果表明，该方案可以根据网络拓扑自适应获得最优的控制器数量，为最合适的控制器分配交换机，并在分布式SDN中实现多控制器架构的均衡部署. 未来针对SDN动态流量网络，如何确保控制器的负载均衡将是研究的重点问题.

参考文献 (13)

姓名
	姓名不能为空！
邮箱
	邮箱不能为空！非法的邮箱地址。
手机号码
	电话不能为空！请输入有效手机号!
标题
	标题不能为空！
留言内容
	内容不能为空！
验证码
	验证码不能为空！验证码错误！

留言板