基于双域注意力和元学习的移动应用行为识别

张文君; 陈丹伟

doi:10.13718/j.cnki.xdzk.2021.12.023

基于双域注意力和元学习的移动应用行为识别

南京邮电大学计算机学院、软件学院、网络空间安全学院，南京 210000

基金项目: 国家重点研发计划项目(2019YFB2101704)

详细信息

作者简介:
张文君，硕士生，主要从事网络流量分析方面的研究 .

中图分类号: TP391.1

Mobile Application Behavior Recognition Based on Dual-Domain Attention and Meta-Learning

School of Computer/School of Software/School of Cyberspace Security of Nanjing University of Posts and Telecommunications, Nanjing 210000, China

摘要: 移动智能设备和移动应用承载了诸多个人信息和办公娱乐功能，通过分析移动应用在使用时产生的网络流量，可以在网络管理、隐私保护以及行为识别方面提供有价值的信息. 文章设计了一种基于双域注意力机制和元学习的识别模型，首先，通过深度可分离卷积模块进行特征提取；其次，通过注意力机制模块从通道和空间2个维度提取注意力，增强行为识别样本的图像纹理特征；同时，利用元学习的策略，进行多任务学习，使得模型在面对新的小样本识别任务时可以有更快速高效的识别效果. 实验结果表明，相比于其他的小样本识别模型，本文模型能够有效地识别出移动应用行为特征.
- 移动应用行为识别 /
- 深度学习 /
- 注意力机制 /
- 元学习 /
- 深度可分离卷积 /
- 小样本分类
Abstract: Mobile smart devices and mobile applications carry a lot of personal information and office entertainment functions. Analysis of the network traffic generated when mobile applications are used can provide valuable information in terms of network management, privacy protection and behavior recognition. In this paper, a recognition model based on dual-domain attention mechanism and meta-learning is designed. First, feature extraction is performed through the deep separable convolution module. Then, attention is extracted from the channel and space dimensions through the attention mechanism module to enhance the texture features of the behavior recognition samples. At the same time, the meta-learning strategy is used to perform multi-task learning, so that the model can have a faster and more efficient recognition effect when facing new small-sample recognition tasks. The results of an experiment show that compared with other small sample recognition models, the model described in this paper can more effectively recognize mobile application behaviors.
- mobile application behavior recognition /
- deep learning /
- attention mechanism /
- meta-learning /
- deep separable convolution /
- small sample classification .

图 1 不同流量识别方式的流程

下载: 全尺寸图片幻灯片

图 2 本文的移动应用行为识别模型

下载: 全尺寸图片幻灯片

图 3 深度可分离卷积示意图

下载: 全尺寸图片幻灯片

图 4 双域注意力模块

下载: 全尺寸图片幻灯片

图 5 模型训练收敛

下载: 全尺寸图片幻灯片

图 6 行为划分参数实验

下载: 全尺寸图片幻灯片

图 7 不同注意力模块

下载: 全尺寸图片幻灯片

图 8 不同注意力模块实验结果

下载: 全尺寸图片幻灯片

图 9 识别模型泛化性实验

下载: 全尺寸图片幻灯片

图 10 实验结果对比

下载: 全尺寸图片幻灯片

表 1 数据集包含的行为种类

用户行为	数量	用户行为	数量
发文字	5 300	发图片	5 100
发红包	3 978	转账	3 978
点赞	5 499	发朋友圈	5 100

下载: 导出CSV

表 2 评估指标参数介绍

	正例	反例
识别为正	TP	FP
识别为反	TN	FN

下载: 导出CSV

表 3 样本数量对实验结果的影响

类型	K=5		K=10		K=15
类型	ACC/%	REC/%	ACC/%	REC/%	ACC/%	REC/%
发文字	99.67	98.90	99.08	99.04	98.17	98.59
发图片	99.28	98.23	95.62	98.15	99.52	99.87
点赞	99.32	99.66	92.98	92.06	99.55	98.46
转账	98.17	97.78	98.73	98.43	96.38	96.13
发红包	98.01	98.44	98.49	97.98	97.36	98.02
发朋友圈	97.90	97.02	98.5	98.88	98.17	98.01

下载: 导出CSV

[1]	GUO YY, WANG W P, ZHANG H, et al. Traffic Engineering in Hybrid Software Defined Network via Reinforcement Learning[J]. Journal of Network and Computer Applications, 2021, 189: 103116. doi: 10.1016/j.jnca.2021.103116
[2]	赵颖, 王权, 黄叶子, 等. 多视图合作的网络流量时序数据可视分析[J]. 软件学报, 2016, 27(5): 1188-1198. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-RJXB201605012.htm
[3]	ALAN H F, KAUR J. Can Android Applications be Identified Using only TCP/IP Headers of Their Launch Time Traffic?[C] //Proceedings of the 9th ACM Conference on Security & Privacy in Wireless and Mobile Networks. New York, NY, USA: ACM, 2016: 61-66.
[4]	WANG Z J, DONG Y N, MAO S W, et al. Internet Multimedia Traffic Classification from QoS Perspective Using Semi-Supervised Dictionary Learning Models[J]. China Communications, 2017, 14(10): 202-218. doi: 10.1109/CC.2017.8107644
[5]	SHAFIQ M, YU X Z, BASHIR A K, et al. A Machine Learning Approach for Feature Selection Traffic Classification Using Security Analysis[J]. The Journal of Supercomputing, 2018, 74(10): 4867-4892. doi: 10.1007/s11227-018-2263-3
[6]	COULL S E, DYER K P. Traffic Analysis of Encrypted Messaging Services: Apple Imessage and Beyond[J]. ACM SIGCOMM Computer Communication Review, 2014, 44(5): 5-11. doi: 10.1145/2677046.2677048
[7]	doi: http://onlinelibrary.wiley.com/doi/10.1002/cpe.5480 LEE K M, PARK K S, HWANG K S, et al. Deep Neural Network Model Construction with Interactive Code Reuse and Automatic Code Transformation[J]. Concurrency and Computation: Practice and Experience, 2020, 32(18): 1002.
[8]	LI D, LI W Z, WANG X L, et al. App Trajectory Recognition over Encrypted Internet Traffic Based on Deep Neural Network[J]. Computer Networks, 2020, 179: 107372. doi: 10.1016/j.comnet.2020.107372
[9]	GU C J, ZHANG S Y, XUE X Z. Encrypted Internet Traffic Classification Method Based on Host Behavior[J]. International Journal of Digital Content Technology and Its Applications, 2011, 5(3): 167-174. doi: 10.4156/jdcta.vol5.issue3.16
[10]	NAN Y H, YANG Z M, YANG M, et al. Identifying User-Input Privacy in Mobile Applications at a Large Scale[J]. IEEE Transactions on Information Forensics and Security, 2017, 12(3): 647-661. doi: 10.1109/TIFS.2016.2631949
[11]	王伟. 基于深度学习的网络流量分类及异常检测方法研究[D]. 合肥: 中国科学技术大学, 2018: 69-90.
[12]	XU Z X, CHEN X L, TANG W, et al. Meta Weight Learning via Model-Agnostic Meta-Learning[J]. Neurocomputing, 2021, 432: 124-132. doi: 10.1016/j.neucom.2020.08.034
[13]	CONTI M, MANCINI L V, SPOLAOR R, et al. Analyzing Android Encrypted Network Traffic to Identify User Actions[J]. IEEE Transactions on Information Forensics and Security, 2016, 11(1): 114-125. doi: 10.1109/TIFS.2015.2478741
[14]	ESPINAL A, ESTRADA R, MONSALVE C. Traffic Model Using a Novel Sniffer that Ensures the User Data Privacy[J]. MATEC Web of Conferences, 2019, 292: 03002. doi: 10.1051/matecconf/201929203002
[15]	doi: http://www.sciencedirect.com/science/article/pii/S0925231219317370 LIU X Q, ZHOU F Y, LIU J, et al. Meta-Learning Based Prototype-Relation Network for Few-Shot Classification[J]. Neurocomputing, 2020, 383(6): 224-234.
[16]	LANDRO N, GALLO I, GRASSA R L. Combining Optimization Methods Using an Adaptive Meta Optimizer[J]. Algorithms, 2021, 14(6): 186. doi: 10.3390/a14060186
[17]	doi: https://link.springer.com/chapter/10.1007/978-3-319-55895-0_12 MUNKHDALAI T, YU H. Meta Networks[J]. Proceedings of Machine Learning Research, 2017, 70: 2254-2257.
[18]	QIAN Q, JIN R, YI J F, et al. Efficient Distance Metric Learning by Adaptive Sampling and Mini-Batch Stochastic Gradient Descent (SGD)[J]. Machine Learning, 2015, 99(3): 353-372. doi: 10.1007/s10994-014-5456-x
[19]	LI H, YANG X, LI Y, et al. Evolutionary Extreme Learning Machine with Sparse Cost Matrix for Imbalanced Learning[J]. ISA Transactions, 2020, 100: 198-209. doi: 10.1016/j.isatra.2019.11.020
[20]	XU J C, DU Q F. Learning Transferable Features in Meta-Learning for Few-Shot Text Classification[J]. Pattern Recognition Letters, 2020, 135: 271-278. doi: 10.1016/j.patrec.2020.05.007
[21]	doi: http://arxiv.org/pdf/1704.06099 TAYLOR V F, SPOLAOR R, CONTI M, et al. Robust Smartphone App Identification via Encrypted Network Traffic Analysis[J]. IEEE Transactions on Information Forensics and Security, 2017, 13(1): 63-78.

图( 10) 表( 3)

计量

文章访问数: 1846
HTML全文浏览数: 1846
PDF下载数: 187
施引文献: 0

全文HTML

开放科学（资源服务）标志码（OSID）：
随着移动设备智能化程度的提高，手机承载了诸多以前只能通过电脑实现的功能和任务. 与此同时，5G已经渐渐进入我们的日常生活，2015-2020年中国手机即时通信用户规模逐年增长. 事实上，网络性能的大幅提升不仅为即时通信类别的应用带来了较大改变，同时也使得移动设备能够为生活、工作、娱乐等各方面的应用需求提供支持. 由此可见，5G对移动端应用市场的蓬勃发展起到了极大的促进作用.

用户在使用每个移动端的应用时会产生各种各样的网络流量，通过分析这些流量可以获取很多信息. 比如，第一，可以对用户的行为作出分析，或者对某个地区某个年龄的用户行为作出分析，从而刻画出用户形象以便更好地推荐；第二，可以实现从攻击者的视角尽早发现一些有恶性行为的应用并进行防范，从而避免出现隐私泄露等安全问题；第三，可以满足某些场景或企业的个性化需求，提高网络服务质量.

传统的移动应用流量识别主要有3种方式，基于端口号识别、基于DPI深度包检测识别和基于机器学习的方式. 其中，基于端口号和DPI深度包检测的流量识别方法是依靠研究人员制订的规则来进行匹配和识别的，此外，基于统计和基于行为的方法都属于传统的机器学习方法，故仍需要手工进行特征选择后，模型才能依据既定特征对待识别样本进行识别. 然而，随着近几年深度学习在各领域的大放异彩，研究学者开始尝试用深度学习解决传统流量识别方法中的问题. 图 1展示了不同流量识别方法的具体流程，深色块表示机器完成的部分. 可以看出，使用深度学习方式可以省略人工进行特征设计的步骤，这已在图像分类、自然语言处理等多个领域得到了验证. 鉴于此，在流量识别领域我们同样能够借助深度学习来提高流量识别的能力. 同时，考虑到在实际应用场景中移动应用迭代频繁的情况，本文采用了元学习多任务训练的方式，解决了识别模型冷启动的问题，实现了小样本场景下的移动应用行为识别.

1. 国内外相关研究工作

网络流量分析^[1-3]一直是网络安全领域一个重要的研究方向. 如今人们对手机的依赖程度越来越高，手机承载着我们越来越多的隐私信息，例如，照片、定位信息、文件甚至是各类金融信息，因此我们尝试通过对移动应用使用中产生的网络流量进行分析，识别用户的行为^[4]，来达到分析用户的行为模式或者是用于场景化管理^[5-6]的目的. 网络流量分析一般分为流量采集、流量处理、特征分析、结果评估4个步骤.

近年来越来越多研究人员开始利用网络流量来识别移动应用中用户的行为，Coull等人^[6]在研究iMessage用户产生的流量时，尽管iMessage对流量进行了加密处理，但通过分析用户与苹果服务器交互时产生的网络数据包的大小等侧面信息，仍可以获取用户的相关操作特征，例如可以识别出消息的长度、语言的种类等，同时，对发消息的行为，包括输入状态和阅读状态等5种行为进行了区分，正确率在90%以上. Lee等人^[7]研究了韩国的一款通信移动应用，在对用户发消息、发图片、添加好友等11种行为产生的网络流量差异进行分析时，通过提取这些加密数据流的数据报文也能够对用户的行为进行识别. Li等人^[8]提出在进行移动应用行为识别时，选取数据报文的时间序列和长度序列作为特征进行分析，也可以不受加密的影响.

上述文献使用的都是传统的分步策略，目前深度学习已经渐渐开始取代手工设计特征^[9]的操作过程. Nan等人^[10]提出将原始的网络数据流量直接作为输入，使用一种基于栈式自编码器SAE的识别方法，开创了端到端方法识别流量的先河. 王伟^[11]同样是将原始的网络数据流量直接作为输入，结合卷积神经网络来输出模型的分类结果，将网络流量的识别很好地与深度学习方式结合到了一起，并且取得了很好的实验效果. 因此，采用深度学习的方式，对网络流量的原始数据进行学习在流量识别领域是可行且效果可观的.

4. 结束语

移动智能设备和移动应用承载了诸多个人信息和日常工作娱乐功能，通过分析移动应用在使用时产生的网络流量可以在网络管理、隐私保护以及行为识别方面提供有价值的信息. 本文针对小样本场景下的移动应用行为识别方式进行了研究，提出了一种基于双域注意力机制的行为识别方式，该方式提高了移动应用行为识别的准确性；文章还采用了元学习的训练方式，解决了小样本场景下，移动应用行为识别冷启动的问题. 当然，本文提出的应用行为识别方式还存在不足和需要改进的地方，使用深度可分离卷积虽然降低了计算量，但注意力机制会增加一部分计算量，因此还需要进一步深入研究计算资源消耗的问题，寻找更加高效的注意力实现方式.

参考文献 (21)

姓名
	姓名不能为空！
邮箱
	邮箱不能为空！非法的邮箱地址。
手机号码
	电话不能为空！请输入有效手机号!
标题
	标题不能为空！
留言内容
	内容不能为空！
验证码
	验证码不能为空！验证码错误！

留言板

基于双域注意力和元学习的移动应用行为识别

南京邮电大学计算机学院、软件学院、网络空间安全学院，南京 210000

作者简介:
张文君，硕士生，主要从事网络流量分析方面的研究 .

Mobile Application Behavior Recognition Based on Dual-Domain Attention and Meta-Learning

School of Computer/School of Software/School of Cyberspace Security of Nanjing University of Posts and Telecommunications, Nanjing 210000, China

计量

基于双域注意力和元学习的移动应用行为识别

作者简介: 张文君，硕士生，主要从事网络流量分析方面的研究
南京邮电大学计算机学院、软件学院、网络空间安全学院，南京 210000

English Abstract

Mobile Application Behavior Recognition Based on Dual-Domain Attention and Meta-Learning

全文HTML

2.1. 采用深度可分离卷积提取特征

2.2. 双域注意力

2.3. 元学习

3.1. 实验数据集

3.2. 实验任务抽样

3.3. 评估指标

3.4. 模型收敛性

3.5. 时间阈值和样本数量影响

3.6. 注意力机制分析

3.7. 泛化性分析

3.8. 实验结果

目录

留言板

基于双域注意力和元学习的移动应用行为识别

南京邮电大学 计算机学院、软件学院、网络空间安全学院，南京 210000

作者简介: 张文君，硕士生，主要从事网络流量分析方面的研究 .

Mobile Application Behavior Recognition Based on Dual-Domain Attention and Meta-Learning

School of Computer/School of Software/School of Cyberspace Security of Nanjing University of Posts and Telecommunications, Nanjing 210000, China

计量

出版历程

基于双域注意力和元学习的移动应用行为识别

作者简介: 张文君，硕士生，主要从事网络流量分析方面的研究 南京邮电大学 计算机学院、软件学院、网络空间安全学院，南京 210000

English Abstract

Mobile Application Behavior Recognition Based on Dual-Domain Attention and Meta-Learning

全文HTML

2.1. 采用深度可分离卷积提取特征

2.2. 双域注意力

2.3. 元学习

3.1. 实验数据集

3.2. 实验任务抽样

3.3. 评估指标

3.4. 模型收敛性

3.5. 时间阈值和样本数量影响

3.6. 注意力机制分析

3.7. 泛化性分析

3.8. 实验结果

目录

南京邮电大学计算机学院、软件学院、网络空间安全学院，南京 210000

作者简介:
张文君，硕士生，主要从事网络流量分析方面的研究 .

作者简介: 张文君，硕士生，主要从事网络流量分析方面的研究
南京邮电大学计算机学院、软件学院、网络空间安全学院，南京 210000