基于重复异构最早完成时间的云计算任务调度算法

蔡昌许

doi:10.13718/j.cnki.xsxb.2020.05.023

基于重复异构最早完成时间的云计算任务调度算法

蔡昌许

曲靖师范学院信息工程学院, 云南曲靖 655011

基金项目: 云南省科技厅高校联合面上项目(2017FH001-060)

详细信息

作者简介:
蔡昌许(1976-), 男, 硕士, 讲师, 主要从事信息管理与信息系统研究 .

中图分类号: TP391

Cloud Computing Task Scheduling Algorithm of Duplication Based Heterogeneous Earliest Finish Time

Chang-xu CAI

College of Engineering, Qujing Normal University, Qujing Yunnan 655011, China

摘要: 针对云计算任务调度算法时间成本消耗大的问题，提出了一种新的算法，即重复异构最早完成时间(Duplication based Heterogeneous Earliest Finish Time，DHEFT)任务调度方法.该方法结合异构最早完成时间算法和任务重复算法，可以大大减少任务最早开始时间和最早完成时间.由于任务优先级对于相关任务调度算法的重要性，该算法中提出了乐观成本表的方法来计算任务优先级，根据优先级调度任务，并复制父任务以降低通信成本并获得最佳调度解决方案.实验结果表明，该文提出的DHEFT在调度长度比和完成时间性能方面优于其他算法，说明该文方法的可行性与有效性.
- 云计算 /
- 任务调度 /
- 重复异构最早完成时间 /
- 任务优先级
Abstract: Aiming at the problem of large time cost of cloud computing task scheduling algorithm, a new algorithm, Duplication based Heterogeneous Earliest Finish Time task scheduling method has been proposed. In the method the heterogeneous earliest finish time algorithm and the task repetition algorithm have been combined, which can greatly reduce the earliest start time and the earliest completion time of the task. Due to the importance of the task priority to the related task scheduling algorithm, the method of calculating the optimistic cost table has been proposed in the algorithm, and task scheduling been completed based on the priority calculated in this method. Then replicating the parent task to reduce communication cost and obtain the best scheduling solution. The experimental results show that the DHEFT proposed in this paper is superior to other algorithms in terms of scheduling length ratio and completion time performance, indicating the feasibility and effectiveness of the proposed method.
- cloud computing /
- task scheduling /
- Duplication based Heterogeneous Earliest Completion Time /
- task priority .

图 1 DAG应用过程

下载: 全尺寸图片幻灯片

图 2 不同算法在图 1中样本任务图的时间表

下载: 全尺寸图片幻灯片

图 3 CCR=0.1时SLR性能对比

下载: 全尺寸图片幻灯片

图 4 CCR=0.5时SLR性能对比

下载: 全尺寸图片幻灯片

图 5 CCR=1时SLR性能对比

下载: 全尺寸图片幻灯片

图 6 CCR=5时SLR性能对比

下载: 全尺寸图片幻灯片

图 7 不同算法的任务完成时间

下载: 全尺寸图片幻灯片

表 1 每个处理器的任务计算时间

v_i	p₁	p₂	p₃
v₁	22	21	36
v₂	22	18	18
v₃	32	27	43
v₄	7	10	4
v₅	29	27	35
v₆	26	17	24
v₇	14	25	30
v₈	29	23	36
v₉	15	21	8
v₁₀	13	16	33

下载: 导出CSV

表 2 不同算法的优先级

v_i	p₁	p₂	p₃	rank_oct	rank_h
v₁	22	21	36	72.7	169
v₂	22	18	18	41	114.3
v₃	32	27	43	37	102.7
v₄	7	10	4	43.7	110
v₅	29	27	35	31	129.7
v₆	26	17	24	41.7	119.3
v₇	14	25	30	17	52.7
v₈	29	23	36	20.7	92
v₉	15	21	8	16.3	42.3
v₁₀	13	16	33	0	20.7

下载: 导出CSV

[1]	WANG B, LI J, WANG C.Cost-Effective Scheduling Precedence Constrained Tasks in Cloud Computing[C]//2017 IEEE 2nd International Conference on Cloud Computing and Big Data Analysis (ICCCBDA).Chengdu: IEEE, 2017.
[2]	XIA Z H, WANG X H, ZHANG L G, et al.A Privacy-Preserving and Copy-Deterrence Content-Based Image Retrieval Scheme in Cloud Computing[J]. IEEE Transactions on Information Forensics and Security, 2016, 11(11):2594-2608. doi: 10.1109/TIFS.2016.2590944
[3]	ALI M, KHAN S U, VASILAKOS A V.Security in Cloud Computing:Opportunities and Challenges[J]. Information Sciences, 2015, 305:357-383. doi: 10.1016/j.ins.2015.01.025
[4]	张少辉, 崔仲远, 韩秋英.云计算环境下基于非均匀窗口蚁群行为的负载平衡算法[J].重庆邮电大学学报(自然科学版), 2016, 28(4):567-574. doi: http://d.old.wanfangdata.com.cn/Periodical/cqydxyxb-zrkx201604019
[5]	AIZAD S, ANJUM A, SAKELLARIOU R.Representing Variant Calling Format as Directed Acyclic Graphs to Enable the Use of Cloud Computing for Efficient and Cost Effective Genome Analysis[C]//2017 17th IEEE/ACM International Symposium on Cluster, Cloud and Grid Computing (CCGRID).Madrid: IEEE, 2017.
[6]	Musial J, Guzek M, Bouvry P, et al.A note on the complexity of scheduling of communication-aware directed acyclic graph[J]. Bulletin of the Polish Academy of Sciences, Technical Sciences, 2018, 66(2):187-191.
[7]	MEIJER R J, GOEMAN J J.A Multiple Testing Method for Hypotheses Structured in a Directed Acyclic Graph[J]. Biometrical Journal, 2015, 57(1):123-143. doi: 10.1002/bimj.201300253
[8]	王李彧, 孙斌, 秦童.改进的DBSCAN聚类算法在云任务调度中的应用[J].北京邮电大学学报, 2017, 40(S1):68-71. doi: http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=bjyddx2017z1015
[9]	KESHANCHI B, SOURI A, NAVIMIPOUR N J.An Improved Genetic Algorithm for Task Scheduling in the Cloud Environments Using the Priority Queues:Formal Verification, Simulation, and Statistical Testing[J]. Journal of Systems and Software, 2017, 124:1-21. doi: 10.1016/j.jss.2016.07.006
[10]	ZUO X Q, ZHANG G X, TAN W.Self-Adaptive Learning PSO-Based Deadline Constrained Task Scheduling for Hybrid IaaS Cloud[J]. IEEE Transactions on Automation Science and Engineering, 2014, 11(2):564-573. doi: 10.1109/TASE.2013.2272758
[11]	AL-MAAMARI A, OMARA F A.Task Scheduling Using PSO Algorithm in Cloud Computing Environments[J]. International Journal of Grid and Distributed Computing, 2015, 8(5):245-256. doi: 10.14257/ijgdc.2015.8.5.24
[12]	KUMARI K R, SENGOTTUVELAN P, SHANTHINI J.A Hybrid Approach of Genetic Algorithm and Multi Objective PSO Task Scheduling in Cloud Computing[J]. Asian Journal of Research in Social Sciences and Humanities, 2017, 7(3):1260-1271. doi: 10.5958/2249-7315.2017.00241.6
[13]	TANG Z, QI L, CHENG Z Z, et al.An Energy-Efficient Task Scheduling Algorithm in DVFS-enabled Cloud Environment[J]. Journal of Grid Computing, 2016, 14(1):55-74.
[14]	陈曦, 毛莺池, 接青, 等.云计算中基于任务分层和时间约束的关联任务调度算法[J].计算机应用, 2014, 34(11):3069-3072. doi: http://d.old.wanfangdata.com.cn/Periodical/jsjyy201411002
[15]	张巧龙, 张桂珠, 吴德龙.基于任务复制的多维QoS云计算任务调度[J].计算机应用, 2014, 34(9):2527-2531. doi: http://d.old.wanfangdata.com.cn/Periodical/jsjyy201409018

图( 7) 表( 2)

计量

文章访问数: 1208
HTML全文浏览数: 1208
PDF下载数: 177
施引文献: 0

全文HTML

云计算是一种计算模型，可以访问共享资源，包括计算机设备，应用程序或存储资源^[1-2].云计算是一种分布式计算，能够提供安全快速、便捷的网络计算服务^[3-4].在云计算中，执行并行应用程序的效率关键取决于用于调度并行应用程序任务的算法，此类应用程序始终由具有优先约束的大量任务组成，并由有向无环图(Directed Acyclic Graph，DAG)表示，其中节点表示应用程序任务，有向边表示依赖性. DAG调度问题已经表明是完全非确定性多项式(Nondeterministic Polynomially，NP)问题^[5-7]，因此研究重点是更好地调度求解.

DAG调度算法大多基于启发式算法，目前的研究提出了多种启发式算法，包括聚类算法、遗传算法、粒子群优化算法、随机调度算法和列表调度算法等.聚类算法^[8]必须有从生成的簇到有界数处理器的映射过程，假设处理器的数目过大，则算法此时不适用.文献[9]提出了一种功能强大且改进的遗传算法.该算法利用进化遗传算法和启发式方法的优点采用基于模型检验技术的行为建模方法，该方法能够提供良好的时间表，但执行时间明显高于其他方法.粒子群优化算法也被用到云计算任务调度中^[10-11]，文献[12]提出一种基于多目标粒子群算法和遗传算法的超启发式资源调度算法作为混合算法，该混合调度算法与现有的基于启发式的调度算法进行比较，在降低成本和提高完工时间方面都有所提高，但该算法的缺点是执行时间仍然较高.

列表调度的基本思想是先计算任务优先级，然后按优先级递减顺序将任务放在列表中，然后根据资源的优先级映射任务.很明显，优先级越高的任务越早执行.常见的列表调度算法之一是异构最早完成时间(Heterogeneous Earliest Finish Time，HEFT)算法，具有复杂度低、性能良好的优点.文献[13]提出一种节能工作流任务调度算法，该方法通过回收松弛时间来合并相对低效的处理器，首先计算所有任务的初始调度顺序，并根据HEFT算法获得整个完工时间和期限.通过使处理器具有运行任务编号和能量利用率，可以关闭最后一个节点并在其上重新分配任务来合并未充分利用的处理器.该算法的任务调度性能还可以提高.

针对现有云计算调度算法存在的问题，提出了一种重复异构最早完成时间的云计算任务调度算法，该算法基于HEFT和任务复制算法，采用乐观成本表的算法来计算优先级，能够降低通信成本并获得最佳调度解决方案.

2. 基于DHEFT任务调度方法

本文DHEFT算法在云计算中被称为完全连接的异构处理器算法，有3个主要阶段：①任务优先化阶段，用于计算任务优先级；②处理器选择阶段，用于选择最合适的处理器来执行当前任务；③复制阶段，用于更早地执行当前任务的执行起始时间.

2.1. 优先级定义

给定DAG，可以根据任务优先级按降序构造任务列表.与HEFT算法相比，有更好的方法来计算任务优先级：Lookahead算法和有限数量异构处理器算法(PEFT算法)，两个算法的主要特点是处理器选择策略. Lookahead算法和PEFT算法最强大的特点是，都有能力预测当前任务和所有子任务分配的影响.虽然Lookahead可以在选择处理器方面做出更好的决策，但是计算优先级的复杂性显著增加.因此，在本文中采用PEFT方法，引入一种新的基于列表的调度算法，即乐观成本表(optimistic cost table，OCT)方法. OCT是一个矩阵，其中行的数目是任务数目，列表示处理器数目. OCT(v_i，p_k)表示处理器p_j上任务v_i的OCT值，通过将DAG从出口节点向上遍历到入口节点，通过等式(6)递归地计算.

其中，c_j，i表示通信成本，如果在处理器p_k上安排任务v_j，则c_j，i为零. w(v_j，p_w)表示任务v_j在处理器p_w上的执行时间. OCT(v_i，p_k)表示最大乐观处理时间任务v_i的后继节点，因为后继任务是在处理器中执行，与处理器可用性无关的最小化处理时间(执行和通信)，在调度开始之前计算OCT.因为OCT是递归定义的，并且子节点已经具有退出节点的乐观成本，所以仅考虑第一级子节点.对于在任何处理器上调度的出口节点，OCT值为零.

通过平均每项任务的OCT，可以计算本文中的任务优先级.

设HEFT算法计算的优先级为rank_h，表 2显示了通过OCT和HEFT两种方式计算的图 1中DAG样本的优先级.

与HEFT优先级相比，OCT优先级在任务的顺序中是不同的.例如，T5的优先级低于T4，因此首先选择T4进行调度.相反，基于rank_h首先选择T5进行调度.本优先级排序算法的主要特征是OCT，反映每个任务和处理器执行后继任务直到退出节点的成本.

2.2. 处理器选择和复制阶段

在按优先级构造任务序列后，将任务分配给处理器，并应用复制来减少完成时间.任务序列中的第一个未调度任务v_i被选择并在处理器p_j上调度. r(v_i，p_j)和EST(v_i，p_j)之间可能有空闲时间，其定义为

当选择任务序列中的任务v_i在处理器p_j上调度时，如果任务v_j∈pred(v_i)满足以下条件：任务v_j在处理器p_j上执行，slot(v_j，p_j)≥w(v_j，p_j)，同时任务v_j从未在处理器p_j上被调度，则可以在处理器p_j上复制任务v_j，以使任务v_i更早地执行，因此任务v_i可以最早使用前驱任务复制完成其执行.本文算法只是在前两个或3个级别上进行复制，因为如果在所有节点上执行操作，复杂性将显着增加，并且前两个或3个级别起到决定性作用，以使总体完工时间减少.

4. 结语

本文提出了一种新的任务调度算法，称为基于复制的异构最早完成时间DHEFT任务调度方法.该算法结合异构最早完成时间算法和任务复制算法，可以减少任务的最早开始时间和最早完成时间，从而缩短任务完成时间.采用乐观成本表方法来计算任务优先级，该表考虑了后继任务的总体成本以获得更好的任务序列.实验结果表明，本文DHEFT调度算法比HEFT算法具有更低的SLR，且在任务完成时间性能方面，本文算法优于其他算法.

参考文献 (15)

姓名
	姓名不能为空！
邮箱
	邮箱不能为空！非法的邮箱地址。
手机号码
	电话不能为空！请输入有效手机号!
标题
	标题不能为空！
留言内容
	内容不能为空！
验证码
	验证码不能为空！验证码错误！

留言板

基于重复异构最早完成时间的云计算任务调度算法

曲靖师范学院信息工程学院, 云南曲靖 655011

作者简介:
蔡昌许(1976-), 男, 硕士, 讲师, 主要从事信息管理与信息系统研究 .

Cloud Computing Task Scheduling Algorithm of Duplication Based Heterogeneous Earliest Finish Time

College of Engineering, Qujing Normal University, Qujing Yunnan 655011, China

计量

基于重复异构最早完成时间的云计算任务调度算法

作者简介: 蔡昌许(1976-), 男, 硕士, 讲师, 主要从事信息管理与信息系统研究
曲靖师范学院信息工程学院, 云南曲靖 655011

English Abstract

Cloud Computing Task Scheduling Algorithm of Duplication Based Heterogeneous Earliest Finish Time

全文HTML

2.1. 优先级定义

2.2. 处理器选择和复制阶段

目录

留言板

基于重复异构最早完成时间的云计算任务调度算法

曲靖师范学院 信息工程学院, 云南 曲靖 655011

作者简介: 蔡昌许(1976-), 男, 硕士, 讲师, 主要从事信息管理与信息系统研究 .

Cloud Computing Task Scheduling Algorithm of Duplication Based Heterogeneous Earliest Finish Time

College of Engineering, Qujing Normal University, Qujing Yunnan 655011, China

计量

出版历程

基于重复异构最早完成时间的云计算任务调度算法

作者简介: 蔡昌许(1976-), 男, 硕士, 讲师, 主要从事信息管理与信息系统研究 曲靖师范学院 信息工程学院, 云南 曲靖 655011

English Abstract

Cloud Computing Task Scheduling Algorithm of Duplication Based Heterogeneous Earliest Finish Time

全文HTML

2.1. 优先级定义

2.2. 处理器选择和复制阶段

目录

曲靖师范学院信息工程学院, 云南曲靖 655011

作者简介:
蔡昌许(1976-), 男, 硕士, 讲师, 主要从事信息管理与信息系统研究 .

作者简介: 蔡昌许(1976-), 男, 硕士, 讲师, 主要从事信息管理与信息系统研究
曲靖师范学院信息工程学院, 云南曲靖 655011