基于混合优化的双模深度学习文本分类方法

吴绪玲

doi:10.13718/j.cnki.xdzk.2022.11.022

基于混合优化的双模深度学习文本分类方法

吴绪玲

西南交通大学希望学院信息工程系，成都 610400

基金项目: 四川省电子商务与现代物流研究中心项目(DSWL21-27)；成都市哲学社会科学重点研究基地课题(2019002)

详细信息

作者简介:
吴绪玲，硕士，讲师，主要从事软件工程方面的研究 .

中图分类号: TP391

Dual-Mode Deep Learning Text Classification Method Based on Hybrid Optimization

WU Xuling

School of Information Engineering, Hope College, Southwest Jiaotong University, Chengdu 610400, China

摘要: 为解决文本分类中分类精度低的问题，提出一种混合优化的双模深度学习文本分类方法. 该方法设计了一种混合优化算法，对深度学习模型进行权值调优，得到相关度高的特征和高性能文本分类结果. 首先对文档进行预处理得到特征集合，设计了基于乌鸦搜索算法(CSA)和蝗虫优化算法(GOA)的混合优化算法，并使用双向门控循环单元(GRU)进行特征选择，得到具有上下文语义信息且相关的特征. 最后，将最优特征输入到混合优化的深度置信网络(DBN)中得到文本分类结果.
- 文本分类 /
- 混合优化算法 /
- 深度学习 /
- 双向门控循环单元 /
- 深度置信网络
Abstract: In order to solve the problem of low classification accuracy in text classification, a dual-mode deep learning text classification method based on hybrid optimization is proposed. This method designs a hybrid optimization algorithm, optimizes the weights of the deep learning model, and obtains optimal features and high-performance text classification results. First, the document is preprocessed to obtain the feature set, and a hybrid optimization algorithm based on the crow search algorithm and the grasshopper optimization algorithm is designed. The hybrid optimized Bi-GRU is used to select the optimal features, and the highly relevant features with context semantic information are obtained. Finally, the optimal features are input into the DBN with hybrid optimized weights to obtain the text classification results.
- text classification /
- crow search algorithm /
- grasshopper optimization algorithm /
- bi-gated recurrent unit /
- deep confidence network .

图 1 GRU结构

下载: 全尺寸图片幻灯片

图 2 DBN结构

下载: 全尺寸图片幻灯片

图 3 基于混合优化的双模深度学习文本分类

下载: 全尺寸图片幻灯片

图 4 英文文本分类的准确率

下载: 全尺寸图片幻灯片

图 5 中文文本分类的准确率

下载: 全尺寸图片幻灯片

图 6 不同方法的文档分类准确率

下载: 全尺寸图片幻灯片

图 7 不同方法的文档分类精确率

下载: 全尺寸图片幻灯片

图 8 不同方法的文档分类召回率

下载: 全尺寸图片幻灯片

表 1 不同测试函数

对应标号	函数名称	范围	最优值
f₁	Ackely函数	[-32, 32]	0
f₂	Rastrigin函数	[-5.12，5.12]	0
f₃	Griewangk函数	[-600, 600]	0
f₄	Sphere函数	[-100, 100]	0
f₅	Schwefel's problem 22函数	[-10, 10]	0
f₆	Sum Squares函数	[-10, 10]	0

下载: 导出CSV

表 2 不同测试函数的试验结果

函数	项目	CSA	本文
f₁	最优值	2.670	8.88×10^-16
	最差值	4.780	8.88×10^-16
	平均值	3.610	8.88×10^-16
	标准差	0.638	0
f₂	最优值	7.990	0
	最差值	39.800	0
	平均值	23.900	0
	标准差	8.030	0
f₃	最优值	2.740×10^-3	0
	最差值	2.850×10^-2	0
	平均值	1.310×10^-2	0
	标准差	7.800×10^-3	0
f₄	最优值	0.027 1	5.21×10^-102
	最差值	0.224 0	9.64×10^-84
	平均值	0.078 6	5.39×10^-85
	标准差	0.047 8	2.08×10^-84
f₅	最优值	0.649	1.55×10^-48
	最差值	3.790	9.51×10^-42
	平均值	1.660	5.12×10^-43
	标准差	0.861	2.07×10^-42
f₆	最优值	0.188	3.91×10^-102
	最差值	3.370	1.61×10^-84
	平均值	1.100	8.07×10^-86
	标准差	0.958	2.52×10^-85

下载: 导出CSV

表 3 不同优化算法的性能对比

优化算法	平均值	优化算法	平均值
萤火虫	9.59×10^-6	和声搜索	9.69×10⁴
布谷鸟	5.54×10^-3	乌鸦搜索CSA	1.66×14⁰
蝙蝠	2.68×10¹	本文	5.12×10^-43

下载: 导出CSV

[1]	DLIGACH D, AFSHAR M, MILLER T. Toward a Clinical Text Encoder: Pretraining for Clinical Natural Language Processing with Applications to Substance Misuse[J]. Journal of the American Medical Informatics Association, 2019, 26(11): 1272-1278. doi: 10.1093/jamia/ocz072
[2]	ZULQARNAIN M, GHAZALI R, GHOUSE M G, et al. Efficient Processing of GRU Based on Word Embedding for Text Classification[J]. JOIV: International Journal on Informatics Visualization, 2019, 3(4): 377-383.
[3]	唐焕玲, 窦全胜, 于立萍, 等. 有监督主题模型的SLDA-TC文本分类新方法[J]. 电子学报, 2019, 47(6): 1300-1308. doi: 10.3969/j.issn.0372-2112.2019.06.017
[4]	KOU G, YANG P, PENG Y, et al. Evaluation of Feature Selection Methods for Text Classification with Small Datasets Using Multiple Criteria Decision-Making Methods[J]. Applied Soft Computing, 2020, 86: 105-116.
[5]	DENG X L, LI Y Q, WENG J, et al. Feature Selection for Text Classification: a Review[J]. Multimedia Tools and Applications, 2019, 78(3): 3797-3816. doi: 10.1007/s11042-018-6083-5
[6]	赵婧, 邵雄凯, 刘建舟, 等. 文本分类中一种特征选择方法研究[J]. 计算机应用研究, 2019, 36(8): 2261-2265. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-JSYJ201908004.htm
[7]	BAHASSINE S, MADANI A, AL-SAREM M, et al. Feature Selection Using an Improved Chi-Square for Arabic Text Classification[J]. Journal of King Saud University - Computer and Information Sciences, 2020, 32(2): 225-231. doi: 10.1016/j.jksuci.2018.05.010
[8]	JOSEPH MANOJ R, ANTO PRAVEENA M D, VIJAYAKUMAR K. An ACO-ANN Based Feature Selection Algorithm for Big Data[J]. Cluster Computing, 2019, 22(2): 3953-3960.
[9]	KOWSARI K, MEIMANDI J, HEIDARYSAFA M, et al. Text Classification Algorithms: a Survey[J]. Information, 2019, 10(4): 150-217. doi: 10.3390/info10040150
[10]	韩众和, 夏战国, 杨婷. CNN-ELM混合短文本分类模型[J]. 计算机应用研究, 2019, 36(3): 663-667, 672. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-JSYJ201903005.htm
[11]	SINGH G, KUMAR B, GAUR L, et al. Comparison between Multinomial and Bernoulli Naïve Bayes for Text Classification[C] //2019 International Conference on Automation, Computational and Technology Management (ICACTM). London, UK. IEEE, 2019: 593-596.
[12]	LIU G, GUO J B. Bidirectional LSTM with Attention Mechanism and Convolutional Layer for Text Classification[J]. Neurocomputing, 2019, 337: 325-338. doi: 10.1016/j.neucom.2019.01.078
[13]	WANG R S, LI Z, CAO J, et al. Convolutional Recurrent Neural Networks for Text Classification[C] //2019 International Joint Conference on Neural Networks (IJCNN). Budapest, Hungary. IEEE, 2019: 1-6.
[14]	胡春涛, 夏玲玲, 张亮, 等. 基于胶囊网络和卷积网络的文本分类对比[J]. 计算机技术与发展, 2020, 30(10): 86-91. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-WJFZ202010016.htm
[15]	后同佳, 周良. 基于双向GRU神经网络和注意力机制的中文船舶故障关系抽取方法[J]. 计算机科学, 2021, 48(S2): 154-158. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-JSJA2021S2025.htm
[16]	HU C H, PEI H, SI X S, et al. A Prognostic Model Based on DBN and Diffusion Process for Degrading Bearing[J]. IEEE Transactions on Industrial Electronics, 2020, 67(10): 8767-8777.

图( 8) 表( 3)

计量

文章访问数: 533
HTML全文浏览数: 533
PDF下载数: 250
施引文献: 0

全文HTML

开放科学(资源服务)标志码(OSID):
作为信息检索、信息过滤等领域的基础，文本分类技术起着至关重要的作用，成为自然语言处理的研究热点^[1-2]. 文本分类的效率和准确度影响了文本处理能力，现在对海量文本的有效处理为语义分析等打下良好基础^[3]. 文本分类中分类结果取决于特征质量及分类方法. 如今，电子文档的数量越来越多，文档特征也随之增加，然而，大多数提取的特征部分是不相关且多余的，高维特征会增加文本分类的计算时间，降低分类结果的准确性^[4].

特征选择是文本分类预处理中克服这一问题的重要步骤，其目的是确定一个包含有限数量的相关特征的子集，这些特征足以维持或提高分类任务的性能^[5]. 传统的特征选择方法有信息增益、卡方分布和主成分法等. 文献[6]提出一种文本分类的特征选择方法，设计了类间集中度和类内分散度评估函数进行特征选择，文献[7]提出了改进卡方度量的特征选择方法，但在大数据时代，这些传统方法很难保证文本分类的准确性. 文献[8]提出了使用优化算法的特征选择，使用蚁群算法和人工神经网络算法实现了用于文本分类的特征选择过程，但是特征选择没有考虑到上下文信息和相关性，且收敛速度慢，易发生停滞，连续优化问题求解较弱.

近些年，将选择的特征子集进行分类得到最终的分类结果，由机器学习发展到深度学习，都已经被用于文本分类. 常用的文本分类方法有决策树、支持向量机、K最近邻居、朴素贝叶斯和神经网络等^[9]. 文献[10]提出一种CNN-ELM混合短文本分类模型，该方法卷积神经网络提取特征并进行优化，然后使用误差最小化极速学习机作为分类器完成短文本分类任务；文献[11]提出了多项式和伯努利朴素贝叶斯的文本分类方法，虽然分类生成的解更简单有效，但是某个参数的估计和新数据的到达会带来很多麻烦，如需要计算先验概率、分类决策存在错误率、对输入数据的表达形式很敏感等；文献[12]提出了注意力机制和卷积层的双向长短期记忆网络(Long Short-Term Memory，LSTM)的文本分类方法，包含双向LSTM，关注机制和卷积层，得到上下文相关的特征，最后softmax分类器用于对处理后的上下文信息进行分类；文献[13]提出一种卷积递归神经网络的文本分类方法，所提出的分类模型使用卷积神经网络来提取本地特征，然后利用LSTM网络的巨大内存能力连接提取的特征，提高文本分类精度；文献[14]中引入胶囊网络替代CNN提取文本特征，将其与LSTM连接形成融合神经网络模型对文本进行分类. 文献[10-14]中基于深度学习的特征学习方法中，对于深度模型的参数寻优方面的研究较少.

为了加大深度学习文本分类准确率，提出一种混合优化的双模深度学习文本分类方法，设计混合优化算法，对双模深度学习模型权值寻优，使用双向GRU进行特征选择，将选择的上下文相关特征子集输入优化后的深度信念网络，从而实现文本分类，提高分类准确率等性能.

4. 结论

本研究提出了一种混合优化的双模深度学习文本分类方法. 首先使用停用词删除和词干提取技术对输入文档进行预处理，以使输入有效并具有特征提取过程的能力；设计了基于GOA和CSA的混合优化算法，使用双向GRU深度学习模型进行特征选择；将选择的特征输入到混合优化的DBN深度模型中进行文本分类. 试验结果表明，本研究中混合优化算法的双模深度学习文本分类方法能够以较高的性能实现文本分类，且性能优于现有方法. 未来工作中可对混合优化算法中的适应度函数进行研究，进一步提高文本分类性能.

参考文献 (16)

姓名
	姓名不能为空！
邮箱
	邮箱不能为空！非法的邮箱地址。
手机号码
	电话不能为空！请输入有效手机号!
标题
	标题不能为空！
留言内容
	内容不能为空！
验证码
	验证码不能为空！验证码错误！

留言板

基于混合优化的双模深度学习文本分类方法

西南交通大学希望学院信息工程系，成都 610400

作者简介:
吴绪玲，硕士，讲师，主要从事软件工程方面的研究 .

Dual-Mode Deep Learning Text Classification Method Based on Hybrid Optimization

School of Information Engineering, Hope College, Southwest Jiaotong University, Chengdu 610400, China

计量

基于混合优化的双模深度学习文本分类方法

作者简介: 吴绪玲，硕士，讲师，主要从事软件工程方面的研究
西南交通大学希望学院信息工程系，成都 610400

English Abstract

Dual-Mode Deep Learning Text Classification Method Based on Hybrid Optimization

全文HTML

1.1. 双向GRU

1.2. 深度置信网络

2.1. 文本文档的预处理

2.2. 混合优化的双模深度学习模型

目录

留言板

基于混合优化的双模深度学习文本分类方法

西南交通大学 希望学院 信息工程系，成都 610400

作者简介: 吴绪玲，硕士，讲师，主要从事软件工程方面的研究 .

Dual-Mode Deep Learning Text Classification Method Based on Hybrid Optimization

School of Information Engineering, Hope College, Southwest Jiaotong University, Chengdu 610400, China

计量

出版历程

基于混合优化的双模深度学习文本分类方法

作者简介: 吴绪玲，硕士，讲师，主要从事软件工程方面的研究 西南交通大学 希望学院 信息工程系，成都 610400

English Abstract

Dual-Mode Deep Learning Text Classification Method Based on Hybrid Optimization

全文HTML

1.1. 双向GRU

1.2. 深度置信网络

2.1. 文本文档的预处理

2.2. 混合优化的双模深度学习模型

目录

西南交通大学希望学院信息工程系，成都 610400

作者简介:
吴绪玲，硕士，讲师，主要从事软件工程方面的研究 .

作者简介: 吴绪玲，硕士，讲师，主要从事软件工程方面的研究
西南交通大学希望学院信息工程系，成都 610400