基于深度学习的云计算虚拟机分类算法

董萍

doi:10.13718/j.cnki.xsxb.2021.05.016

摘要: 随着云计算数据中心规模及复杂性的不断增长，其监控和管理的可扩展性问题已逐渐成为一项挑战性任务. 对云计算平台中相似行为的虚拟机进行聚类处理，可提升云计算平台监控和管理的可扩展性. 然而，在准确率和时效性上，现有的虚拟机聚类技术无法满足云计算平台的要求. 本文提出一种基于深度学习的虚拟机分类算法，即对云计算平台中虚拟机的行为进行分析，将具有相似行为的虚拟机进行分类，然后将同类的虚拟机部署在尽可能少的服务器上、降低基础设施成本，从而提升云计算数据中心监控和管理的可扩展性. 采用真实云数据中心的虚拟机数据对本文算法及同类算法进行对比实验，结果表明本文算法准确率更高、实时性更好，可满足云计算平台的要求.

Abstract: With the increasing scale and complexity of cloud computing data centers, the scalability of their monitoring and management has become a challenging task. Existing literature shows that clustering virtual machines (VM) with similar behaviors in cloud computing platform can improve the scalability of monitoring and management of cloud computing platform. However, in terms of accuracy and timeliness, existing virtual machine clustering technology cannot meet the requirements of cloud computing platform. In order to overcome this problem, a virtual machine classification algorithm based on deep learning is proposed. Virtual machines with similar behaviors are classified by analyzing their behaviors. Then, similar virtual machines are deployed on as few servers as possible to reduce infrastructure costs and improve the scalability of cloud computing data center monitoring and management. And finally, the virtual machine data from real cloud data center are used to compare the proposed algorithm and the similar algorithm. Experimental results show that the proposed algorithm has higher accuracy and better real-time performance, which can meet the requirements of cloud computing platform.

Key words:

全文HTML

云计算已成为通过网络交付复杂云服务被广泛采用的范例，并为科学计算领域提供了更高效的技术与支撑环境^[1]. 它以网络化的方式聚合计算能力与通信资源，使用虚拟化技术将大量成本低、计算能力弱的资源整合为一个强大的资源池. 因此，云计算能够实现统一管理和资源调配，提升云服务性能和价格优势^[2].

在过去几年里，云服务器的数量及背后基础设施的复杂性都在迅速增加. 云计算基础设施在未来几年应对日益增长的资源需求的能力，将对未来新兴数字技术的发展起到至关重要的作用. 在基础设施即服务(infrastructure as a service，IaaS)系统中，资源监控和资源管理是特别关键的任务. 在这些系统中，大量且不断增长的数据被收集，用于管理客户委托的虚拟环境^[3-4]. 在这些云系统中，数据中心管理员通常采用黑箱方法，其中每个虚拟机(virtual machines，VM)都被认为是独立于其他虚拟机的，这对监控和管理任务的可伸缩性造成了负面影响.

文献[5-6]研究表明，IaaS云系统中的可伸缩性问题，可以通过在资源使用时聚类具有相似行为的VM来改善，即对相似行为的VM进行聚类化分组管理. 例如，自动测定相似的VM，然后允许系统来识别每个类的几个虚拟机代表，紧随其后的是同一个类的其他成员. 这些理论已被用来提高监控策略的可伸缩性，最近还被应用到一个VM管理案例中，即IaaS数据中心的服务器整合中. 在文献[7-8]中，作者通过使用基于类的方法，提出了云监控和管理可扩展性的建议. 在文献[9]中，作者利用资源相关性和主成分分析对虚拟机行为进行建模，并提出了一种K均值聚类算法. 在文献[10]中，作者基于直方图的表示对VMs行为进行建模，使用Bhattacharyya距离来度量VMs的相似性，提出了一种用于聚类的谱算法. 但是，上述聚类技术只能应用于超过24 h的时间序列，即使在这种条件下它们也具有对VM错误分类的问题. 因此，在VM识别准确率和时效性上，现有聚类技术无法满足云计算数据中心监控及管理的可扩展性要求.

针对以上问题，本文提出一种基于深度学习的VM分类算法，通过提高VM分类的准确率和实时性，达到提升云数据中心监控及管理可扩展性的目的.

1. IaaS云系统模型

IaaS系统是利用VM自动聚类来实现云监控和管理的可伸缩方法. 第一层由本地管理层组成，它在数据中心的每个物理服务器上执行：利用服务器上承载的VM资源度量实时监控过载情况，当监控到负载过重的服务器时利用动态VM迁移. 第二层是全局管理层，它托管在管理节点之上：负责定期执行整合技术，将VM放在尽可能少的服务器上，降低基础设施成本，避免昂贵的资源过度供应.

基于VM聚类的云计算系统将运行相同客户应用软件的相似VM分组在一起. 由于可伸缩性原因，聚类处理往往应用于同一客户的VM. 在聚类之后，每个已标识的类只选择很少的VM代表. 一般选择3个VM代表，因为所选择的代表可能会意外地更改其与类相关的行为. 对每个类的VM代表进行高采样频率监控，为周期性整合任务收集信息. 假设非代表性VM遵循相同类代表的行为，使用更粗的粒度进行监控，可识别影响类更改的行为漂移.

由于IaaS云系统的提供者和管理员通常将每个VM视为一个黑箱，需要独立于其他VM进行监控和管理，从而加剧了这些任务的可伸缩性问题. 因此，自动聚类管理的IaaS云系统具有以下优势：①监控系统可扩展性；②服务器整合过程的可扩展性；③系统资源需求估算效率.

4. 结语

本文的研究重点是提升云基础架构的可扩展性问题，即通过对表现出相似行为的虚拟机进行分类，从而实现提高监控和管理可扩展性的解决方案. 由于现有VM群集和分类方法的特点是在准确的VM识别和及时响应之间进行权衡，无法同时满足VM识别的准确率和实时性. 为了解决这个问题，本文基于深度学习技术，提出了一种新颖的VM分类算法. 通过来自真实云数据中心的数据验证了本文算法的有效性，在VM识别率和响应时间方面均具有较好的性能表现.

参考文献 (12)

姓名
	姓名不能为空！
邮箱
	邮箱不能为空！非法的邮箱地址。
手机号码
	电话不能为空！请输入有效手机号!
标题
	标题不能为空！
留言内容
	内容不能为空！
验证码
	验证码不能为空！验证码错误！

	4	8	16	32	64	128	256
PCA	-	17.9	17.5	16.1	15.4	15.2	15.1
Ag	-	1.8	2.8	2.3	1.9	1.8	2.4
灰度区域	-	47.8	41.1	27.8	22.3	19.9	18.7
本文算法	0	0	0.03	0.64	0.76	1.27	1.17

[1]	谢兵. 基于移动云计算的计算迁移能效算法[J]. 计算机应用研究, 2020, 37(10): 3014-3019. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-JSYJ202010027.htm
[2]	齐平, 王福成, 王必晴, 等. 云计算环境下基于可靠性感知的任务调度算法[J]. 计算机工程与科学, 2018, 40(11): 1925-1935. doi: 10.3969/j.issn.1007-130X.2018.11.003
[3]	DELFORGE P, WHITNEY J. Data Center Efficiency Assessment-Scaling up Energy Efficiency Across the Data Center Industry: Evaluating Key Drivers and Barriers[EB/OL]. (2014-08-01)[2020-03-18]. https://www.nrdc.org/sites/default/files/data-center-efficiency-assessment-IP.pdf.
[4]	CANALI C, LANCELLOTTI R. AGATE: Adaptive Gray Area-Based TEchnique to Cluster Virtual Machines with Similar Behavior[J]. IEEE Transactions on Cloud Computing, 2019, 7(3): 650-663. doi: 10.1109/TCC.2017.2664831
[5]	何远德, 黄奎峰. 移动云环境面向多重服务选择的计算卸载算法[J]. 计算机应用研究, 2020, 37(6): 1633-1637, 1651. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-JSYJ202006005.htm
[6]	HINZ M, KOSLOVSKI G P, MIERS C C, et al. A Cost Model for IaaS Clouds Based on Virtual Machine Energy Consumption[J]. Journal of Grid Computing, 2018, 16(3): 493-512. doi: 10.1007/s10723-018-9440-8
[7]	CANALI C, LANCELLOTTI R. Exploiting Classes of Virtual Machines for Scalable IaaS Cloud Management[C]//2015 IEEE Fourth Symposium on Network Cloud Computing and Applications (NCCA). Munich: IEEE, 2015.
[8]	CANALI C, CHIARAVIGLIO L, LANCELLOTTI R, et al. Joint Minimization of the Energy Costs from Computing, Data Transmission, and Migrations in Cloud Data Centers[J]. IEEE Transactions on Green Communications and Networking, 2018, 2(2): 580-595. doi: 10.1109/TGCN.2018.2796613
[9]	CANALI C, LANCELLOTTI R. Improving Scalability of Cloud Monitoring through PCA-Based Clustering of Virtual Machines[J]. Journal of Computer Science and Technology, 2014, 29(1): 38-52. doi: 10.1007/s11390-013-1410-9
[10]	CANALI C, LANCELLOTTI R. Automatic Virtual Machine Clustering Based on Bhattacharyya Distance for Multi-Cloud Systems[C]//Proceedings of the 2013 International Workshop on Multi-cloud Applications and Federated Clouds-Multi Cloud. New York: ACM Press, 2013.
[11]	CANALI C, LANCELLOTTI R. Exploiting Classes of Virtual Machines for Scalable IaaS Cloud Management[C]//2015 IEEE Fourth Symposium on Network Cloud Computing and Applications (NCCA). Munich: IEEE, 2015.
[12]	HAN Z D. Dyna: a Method of Momentum for Stochastic Optimization[EB/OL]. (2018-05-13)[2020-03-10]. https://arxiv.org/abs/1805.04933.

留言板