自适应边缘样本识别的深度聚类算法

李俊霞; 钱宇华; 马国帅; 许皓

doi:10.13718/j.cnki.xdzk.2023.03.003

自适应边缘样本识别的深度聚类算法

1.
山西大学大数据科学与产业研究院，太原 030006

2.
山西大学计算机与信息技术学院，太原 030006

3.
山西大学计算智能与中文信息处理教育部重点实验室，太原 030006

基金项目: 国家重点研发计划项目(2021ZD0112400)；国家自然科学基金项目(62136005, 62106132)；山西省青年三晋学者项目；山西省高等学校科技创新项目(2019L0034)；山西省青年科学基金项目(20210302124556)

详细信息

作者简介:
李俊霞，硕士研究生，主要从事图神经网络及数据挖掘研究 .

通讯作者: 钱宇华，教授，博士研究生导师;

中图分类号: TP391

Depth Clustering Algorithm for Adaptive Edge Samples Recognition

1.
Institute of Big Data Science and Industry, Shanxi University, Taiyuan 030006, China

2.
School of Computer and Information Technology, Shanxi University, Taiyuan 030006, China

3.
Key Laboratory of Computational Intelligence and Chinese Information Processing, Ministry of Education, Shanxi University, Taiyuan 030006, China

摘要: 深度神经网络因其强大的非线性映射和特征提取能力被广泛应用于聚类中，然而，现有的大多数深度聚类网络仅仅考虑了样本的特征信息，并未有效利用样本空间位置的分布以及样本间的关联信息. 本研究融合了样本的特征信息以及样本间的空间位置信息和关联关系，提出了自适应边缘样本识别的深度聚类算法(Auto-CB). 在使用自编码器学习样本特征表示的同时，通过图神经网络学习样本间的结构信息；然后利用自注意力机制自适应地将样本划分为簇中心样本和边缘样本，并分别使用K-means和多数投票机制对其聚类；在5个数据集上与7个深度聚类以及基于图神经网络的聚类算法进行了性能对比. 结果表明，利用簇中心样本与边缘样本之间的潜在关联关系可以有效促进样本的特征表示，并在聚类任务中取得了更好的效果.
- 深度聚类 /
- 图神经网络 /
- 关联关系 /
- 边缘样本 /
- 结构特征
Abstract: Deep neural network is widely used in clustering because of its powerful nonlinear mapping and feature extraction ability. However, most of the existing deep clustering networks only take the characteristic information of samples into account, and do not take full advantages of the spatial location distributions of samples and the correlation information between samples. This paper combines the characteristic information of samples, the spatial location information and correlation relationships between samples, and proposes an depth clustering algorithm, Auto-CB for adaptive edge sample recognition. While using the self-encoder to learn the feature representation of samples, the structural information between samples is learned through graph neural network. Then, the self-attention is used to adaptively divide the samples into cluster center samples and edge samples, K-means and majority voting mechanism are used to cluster them, respectively. This paper compares the performance of five data sets with seven deep clustering and clustering algorithms based on graph neural network. The results show that using the potential correlation between cluster center samples and edge samples can promote the feature representation of samples and achieve better results in clustering tasks.
- clustering /
- graph neural network /
- association relationship /
- edge samples /
- structure characteristics .

图 1 自适应边缘样本识别的深度聚类算法模型

下载: 全尺寸图片幻灯片

图 2 不同k值的聚类结果

下载: 全尺寸图片幻灯片

图 3 簇中心样本和边缘样本比例的实验结果

下载: 全尺寸图片幻灯片

图 4 预测结果与真实结果的可视化聚类效果

下载: 全尺寸图片幻灯片

表 1 数据集基本情况

数据集	类型	数量	种类	维度
USPS	Image	9298	10	256
HHAR	Record	10 299	6	561
Reuters	Text	10 000	4	2 000
MINIST	Image	10 000	10	784
Fashion_MINIST	Image	10 000	10	784

下载: 导出CSV

表 2 在5个数据集上的聚类结果(均值)

Dataset	Metric	K-means	AE	DEC	IDEC	GAE	VGAE	SDCN	Auto-CB
USPS	ACC	66.82	71.04	73.31	76.22	63.10	56.19	78.08	78.99
	NMI	62.63	67.53	70.58	75.56	60.69	51.08	79.51	77.97
	ARI	54.55	58.83	63.70	67.86	50.30	40.96	71.84	71.10
	F1	64.78	69.74	71.82	74.63	61.84	53.63	76.98	76.40
HHAR	ACC	59.98	68.69	69.39	71.05	62.33	71.30	84.26	86.36
	NMI	58.86	71.42	72.91	74.19	55.06	62.95	79.90	80.25
	ARI	46.09	60.36	61.25	62.83	42.63	51.47	72.84	73.11
	F1	58.33	66.36	67.29	68.63	62.64	71.55	82.58	83.32
Reuters	ACC	54.04	74.90	73.58	75.43	54.40	60.85	77.15	81.03
	NMI	41.54	49.69	47.50	50.28	25.92	25.51	50.82	60.31
	ARI	27.95	49.55	48.44	51.26	19.61	26.18	55.36	62.59
	F1	41.28	60.96	64.25	63.21	43.53	57.14	65.48	67.96
MINIST	ACC	52.15	65.11	57.96	66.84	64.59	56.53	81.63	82.35
	NMI	48.21	55.79	49.19	62.06	14.61	15.04	82.44	83.66
	ARI	36.397	43.63	36.42	50.38	37.27	33.58	75.92	76.86
	F1	52.50	60.25	55.44	59.91	15.92	14.86	79.49	80.23
Fashion-MINIST	ACC	46.69	58.15	54.04	66.84	58.91	55.42	53.68	55.86
	NMI	50.63	60.88	52.58	62.06	21.28	14.50	57.50	58.59
	ARI	33.92	45.24	37.62	50.38	44.67	30.26	40.41	56.76
	F1	44.28	55.95	52.47	59.91	18.56	13.37	52.81	54.16

下载: 导出CSV

表 3 损失消融的ACC指标

数据集	AE	None_CB	Auto-CB
USPS	71.04	77.23	78.99
HHAR	59.98	76.11	86.36
Reuters	54.04	80.10	81.03
MINIST	52.15	81.50	82.35
Fashion_MINIST	46.69	51.83	55.86

下载: 导出CSV

[1]	HINTON G E, SALAKHUTDINOV RR. Reducing the Dimensionality of Data with Neural Networks[J]. Science, 2006, 313(5786): 504-507. doi: 10.1126/science.1127647
[2]	VINCENT P, LAROCHELLE H, BENGIO Y, et al. Extracting and Composing Robust Features with Denoising Autoencoders[C] //ICML '08: Proceedings of the 25th international conference on Machine learning. 2008: 1096-1103.
[3]	SU S R, GAO Z F, ZHANG H Y, et al. Detection of Lumen and Media-Adventitia Borders in IVUS Images Using Sparse Auto-Encoder Neural Network[C] //2017 IEEE 14th International Symposium on Biomedical Imaging. Melbourne, VIC, Australia. IEEE, 2017: 1120-1124.
[4]	HAN J W, ZHANG D W, HU X T, et al. Background Prior-Based Salient Object Detection via Deep Reconstruction Residual[J]. IEEE Transactions on Circuits and Systems for Video Technology, 2015, 25(8): 1309-1321. doi: 10.1109/TCSVT.2014.2381471
[5]	XIE J Y, GIRSHICK R, FARHADI A. Unsupervised Deep Embedding for Clustering Analysis[C] //Proceedings of the 33rd International Conference on International Conference on Machine Learning-Volume 48. June 19-24, 2016, New York, NY, USA. New York: ACM, 2016: 478-487.
[6]	KING W I. The Annals of Mathematical Statistics[J]. The Annals of Mathematical Statistics, 1930, 1(1): 1-2. doi: 10.1214/aoms/1177733256
[7]	GUO X F, GAO L, LIU X W, et al. Improved Deep Embedded Clustering with Local Structure Preservation[C] //Proceedings of the Twenty-Sixth International Joint Conference on Artificial Intelligence. August 19-26, 2017. Melbourne, Australia. California: International Joint Conferences on Artificial Intelligence Organization, 2017: 1753-1759.
[8]	JIANG Z X, ZHENG Y, TAN H C, et al. Variational Deep Embedding: an Unsupervised and Generative Approach to Clustering[C]//Proceedings of the Twenty-Sixth International Joint Conference on Artificial Intelligence. August 19-26, 2017. Melbourne, Australia. California: International Joint Conferences on Artificial Intelligence Organization, 2017.
[9]	WANG C, PAN S R, HU R Q, et al. Attributed Graph Clustering: a Deep Attentional Embedding Approach[C] //Proceedings of the Twenty-Eighth International Joint Conference on Artificial Intelligence. August 10-16, 2019. Macao, China. California: International Joint Conferences on Artificial Intelligence Organization, 2019.
[10]	PAN S R, HU R Q, FUNG S F, et al. Learning Graph Embedding with Adversarial Training Methods[J]. IEEE Transactions on Cybernetics, 2020, 50(6): 2475-2487. doi: 10.1109/TCYB.2019.2932096
[11]	BO D Y, WANG X, SHI C, et al. Structural Deep Clustering Network[C] //Proceedings of The Web Conference 2020. April 20-24, 2020, Taipei, New York: ACM, 2020: 1400-1410.
[12]	KIPF T N, WELLING M. Semi-Supervised Classification with Graph Convolutional Networks[EB/OL]. (2016-12-22)[2022-02-21]. https://arxiv.org/abs/1609.02907.
[13]	XIA C Y, HSU W, LEE M L, et al. BORDER: Efficient Computation of Boundary Points[J]. IEEE Transactions on Knowledge and Data Engineering, 2006, 18(3): 289-303. doi: 10.1109/TKDE.2006.38
[14]	QIU B Z, YUE F, SHEN J Y. BRIM: An Efficient Boundary Points Detecting Algorithm[M] //Advances in Knowledge Discovery and Data Mining. Berlin, Heidelberg: Springer Berlin Heidelberg, 2007: 761-768.
[15]	薛丽香, 邱保志. 基于变异系数的边界点检测算法[J]. 模式识别与人工智能, 2009, 22(5): 799-802. doi: 10.3969/j.issn.1003-6059.2009.05.020
[16]	邱保志, 杨洋, 杜效伟. BRINK: 基于局部质变因子的聚类边界检测算法[J]. 郑州大学学报(工学版), 2012, 33(3): 117-120. doi: 10.3969/j.issn.1671-6833.2012.03.030
[17]	XIANG L L. Clustering Boundary Detection Technology for Mixed Attribute Data Set[J]. Control and Decision, 2015, 30(1): 171-175.
[18]	LORE K G. LLNet: a Deep Autoencoder Approach to Natural Low-Light Image Enhancement[J]. Pattern Recognition, 2017, 61: 650-662. doi: 10.1016/j.patcog.2016.06.008
[19]	DAI J J, SONG H, SHENG G H, et al. Cleaning Method for Status Monitoring Data of Power Equipment Based on Stacked Denoising Autoencoders[J]. IEEE Access, 2017, 5: 22863-22870. doi: 10.1109/ACCESS.2017.2740968
[20]	SUN M, ZHANG X W, VAN HAMME H, et al. Unseen Noise Estimation Using Separable Deep Auto Encoder for Speech Enhancement[J]. IEEE/ACM Transactions on Audio, Speech, and Language Processing, 2016, 24(1): 93-104. doi: 10.1109/TASLP.2015.2498101
[21]	ZENG K, YU J, WANG R X, et al. Coupled Deep Autoencoder for Single Image Super-Resolution[J]. IEEE Transactions on Cybernetics, 2017, 47(1): 27-37. doi: 10.1109/TCYB.2015.2501373
[22]	MEHTA J. RODEO: Robust DE-AliasingautoencOder for Real-Time Medical Image Reconstruction[J]. Pattern Recognition, 2017, 63: 499-510. doi: 10.1016/j.patcog.2016.09.022
[23]	RUMELHART D E, HINTON G E, WILLIAMS R J. Learning Representations by Back-Propagating Errors[J]. Nature, 1986, 323(6088): 533-536. doi: 10.1038/323533a0
[24]	NG A. Sparse Autoencoder[J]. CS294A Lecture Notes, 2011(72): 1-19.
[25]	MAKHZANI A, FREY B. K-Sparse Autoencoders[EB/OL]. (2014-03-22)[2022-03-21]. https://arxiv.org/abs/1312.5663.
[26]	KIPF T N, WELLING M. Variational Graph Auto-Encoders[EB/OL]. (2016-11-21)[2022-03-21]. https://arxiv.org/abs/1611.07308.
[27]	VAN D, MAATEN L, HINTON G. Visualizing Data Using t-SNE[J]. Journal of Machine Learning Research, 2008, 9(11): 2579-2605.
[28]	LE CUN Y, MATAN O, BOSER B, et al. Handwritten Zip Code Recognition with Multilayer Networks[C] //[1990] Proceedings. 10th International Conference on Pattern Recognition. June 16-21, 1990, Atlantic City, NJ, USA. IEEE, 2002: 35-40.
[29]	STISEN A, BLUNCK H, BHATTACHARYA S, et al. Smart Devices are Different: Assessing and MitigatingMobile Sensing Heterogeneities for Activity Recognition[C] //SenSys '15: Proceedings of the 13th ACM Conference on Embedded Networked Sensor Systems. 2015: 127-140.
[30]	LEWIS D D, YANG Y M, ROSE T G, et al. RCV1: a New Benchmark Collection for Text Categorization Research[J]. Journal of Machine Learning Research, 2004, 5: 361-397.
[31]	LECUN Y, BOTTOU L, BENGIO Y, et al. Gradient-Based Learning Applied to Document Recognition[J]. Proceedings of the IEEE, 1998, 86(11): 2278-2324. doi: 10.1109/5.726791
[32]	XIAO H, RASUL K, VOLLGRAF R. Fashion-MNIST: a Novel Image Dataset for Benchmarking Machine Learning Algorithms[EB/OL]. (2017-08-25)[2022-030-1]. https://arxiv.org/abs/1708.07747.
[33]	HARTIGAN J A, WONG M A. Algorithm AS 136: a K-Means Clustering Algorithm[J]. Applied Statistics, 1979, 28(1): 100. doi: 10.2307/2346830

图( 4) 表( 3)

计量

文章访问数: 1563
HTML全文浏览数: 1563
PDF下载数: 419
施引文献: 0

全文HTML

开放科学(资源服务)标志码(OSID):
聚类分析是通过挖掘物理或抽象对象的潜在关联关系，并依据某一特定标准将其划分为不同团簇的过程. 随着数据的爆炸式增长，依赖于计算样本距离的传统聚类算法对于高维、海量数据难以有效提取样本的特征从而达到理想的聚类效果. 具有非线性映射能力的深度神经网络，能够将高维的大规模数据特征映射到低维空间中，从而为聚类分析提供更好的数据. 由于自编码器泛化性强、无需标注的特点，自编码器^[1]被用来将输入的高维数据压缩成高效的低维数据表示，从而进行下游任务，并在图像降噪^[2]、目标识别^[3-4]等方面取得了良好的效果.

然而在对输入数据进行表示的过程中，自编码器通常仅仅关注于样本的自身特征，未考虑样本之间的潜在联系对样本特征学习和聚类分析的影响. 样本之间的结构信息可以有效地促进样本特征的判别性并且简化样本之间的复杂性，最典型的方法是图神经网络，通过捕捉样本之间的图结构信息，将邻域样本特征和自身特征进行融合，作为该样本的特征表示，使得样本的特征更适合聚类. 样本和样本之间往往存在着各种各样的深层次关联关系，虽然图神经网络能学习到样本的结构信息，但是往往需要很长的时间才能拟合出样本之间的分布. 因此通过只依靠神经网络学习样本之间的结构信息和特征信息远远不够，只有显式地利用样本和样本之间的结构关系，分析样本之间的空间位置分布，才能挖掘到样本之间的深层次信息，并且提高特征的判别能力.

一般地，具有聚类性质的数据集在各个类簇之间往往存在着所属类别不明确的边缘样本. 类簇的密度通常由内到外越来越稀疏，簇中心样本密度相对密集，边缘样本相对稀疏. 边缘样本一般处于密度发生跳变的区域，同时具有两个或者两个类簇以上的特征，造成边缘样本在很大程度上与聚类内部的簇中心样本有着不同的性质. 边界区域的样本以及相应的邻域样本的隶属信息间接影响类簇的结构变化，因此，在聚类样本处理中，同一类簇中不同空间位置的样本应该进行区分度量.

本研究针对现有的深度聚类算法中存在基于原始的K近邻算法构建样本之间的拓扑信息不足、易出现样本之间特征趋同、未考虑样本的空间分布以及样本之间的可分性较差等问题，提出了一种自适应边缘样本识别的深度聚类算法(Auto-CB)，将样本动态划分为边缘样本和簇中心样本来学习样本和样本之间的关联关系，显式利用样本与样本之间的关联关系促进聚类效果. 将5个数据集和7个深度聚类的算法进行了对比，结果表明Auto-CB算法能有效挖掘样本之间的关联关系并改善聚类效果.

1. 相关研究

深度聚类分析是机器学习和数据挖掘领域中非常重要的一项技术，用于在大量复杂的数据中寻找数据之间隐含的分布模式以及关联性规则. 样本的特征表示学习决定聚类的效果，深度神经网络能对高维复杂数据分布进行模拟，具有强大的非线性拟合数据的表示能力. 2016年Xie等^[5]提出深度嵌入聚类(DEC)模型联合优化深度嵌入特征表示和聚类，通过软分配进行迭代优化. 只使用深度自编码器中的编码器进行特征学习和优化，丢弃了解码器，通过计算辅助目标分布和最小化KL散度^[6]之间的差异进行迭代，取得了良好的效果，成为了新的深度聚类算法的参考. 但是，DEC仅仅依靠聚类损失对编码器进行约束，破坏了数据结构以及扭曲了嵌入空间，削弱了嵌入特征的表示能力. 为此，Guo等^[7]提出改进的深度嵌入聚类(IDEC)，保留了数据的局部结构，在聚类损失的基础上添加了重构损失，以约束自编码器学习更好的特征表示.

尽管基于提取数据表示的深度神经网络取得了快速的进展，但是大多数模型未能有效提取样本之间隐藏的结构信息. 为了尽可能地捕捉不同数据样本之间的结构信息，一些研究工作开始在聚类中引入了图卷积神经网络. 2017年Jiang等^[8]提出了基于自动编码器的图自编码器(GAE)和基于变分自编码器的变分图自编码器(VGAE). 2019年，Wang等^[9]提出基于自注意力机制的图嵌入聚类网络(DAE)，在DEC聚类损失优化网络学习特征表示的基础上利用注意力机制学习样本之间的拓扑结构和特征表示. 2020年，Pan等^[10]在GAE的基础上提出了一种图嵌入的对抗性正则化框架(ARGA，ARVGA). Bo等^[11]提出将图结构信息集成到深度聚类中，并设计了双重自监督机制指导GCN^[12]学习样本的多重数据结构和自编码器的多重数据表示相结合的结构化深度聚类网络(SDCN). 尽管经典的基于结构信息的聚类算法能获得较好的聚类效果，但是由于数据密度分布不均，类和类之间的边缘样本仍然难以区分.

截止目前，已经提出了一系列的边缘样本检测方法. BORDER^[13]算法根据数据样本的反向k近邻个数来检测边界样本，边界样本的反向k近邻的个数往往比簇中心样本的个数更少，但是在含有噪声的数据集中，BORDER算法并不能正确识别边缘样本和噪声样本. BRIM^[14]算法利用数据点的正向和负向半邻域的样本个数的差别标注边界样本，算法能有效区分噪声样本和边缘样本，但是BRIM却不能检测多密度数据集的边缘样本. BAND算法提出了K距离的概念，并根据K距离定义提出局部密度和变异系数区分边缘样本，能有效区分噪声样本和边缘样本并且在多密度数据中依然能取得好的聚类效果^[15]. BRINK算法在K距离的基础上提出了局部质变因子LOF的概念，根据LOF值的大小检测边界样本^[16]. BERGE算法通过计算样本的局部密度的相关系数标记边缘样本，但是不能应用于高维空间^[17].

样本的空间分布以及样本之间复杂的关联关系在各个领域呈现出不同程度的需求. 在传统聚类任务中认为样本是互相独立的，通过计算样本之间的相似度对数据样本划分类簇，然而样本之间往往存在着各种各样不同强度的相关性甚至相互依赖关系. 虽然基于样本特征和数据结构进行聚类一定程度上获得了好的聚类效果，但是也存在一些不足：一是目前深度神经网络是把网络所有的节点看作同等重要，对节点之间的空间分布没有深入考虑和研究，不能合理地反映出不同样本在聚类中的影响程度. 二是没有显式地利用样本和样本之间的关联关系，只是依靠深度神经网络学习样本的特征和样本之间的结构信息，往往需要很长时间才能拟合出样本之间的非线性关系. 三是深层次的图神经网络容易产生过平滑现象，样本之间的可分性较差，对样本特征学习和图结构的信息利用不够充分.

为了充分利用样本与样本之间的关联关系，本研究提出了基于自注意力的自适应样本划分深度聚类算法，在自编码器和图神经网络分别学习样本特征和结构信息的基础上，动态将样本划分为簇中心样本和边缘样本，通过显式挖掘和利用簇中心样本和边缘样本之间的关联关系，促进特征的学习和样本聚类.

4. 结论

本研究在自编码器学习样本表示和图卷积神经网络学习样本结构特征的基础上，基于样本的空间分布自适应将样本分为簇中心样本和边缘样本. 通过利用簇中心样本和边缘样本之间的关联关系促进样本特征的表示学习和样本结构信息收集，提出了基于自适应边缘样本识别的深度聚类算法(Auto-CB). 在各种开放的数据集上，Auto-CB算法获得了较好的聚类结果. 本研究通过KNN一次构建样本之间的结构信息，根据样本所处空间位置的不同赋予样本不同的权重，迭代式地将样本划分为边缘样本和簇中心样本，这种划分从侧面反映了样本之间的关系，可以获得更为详细地明确样本空间分布，更准确地获得边界样本的所属类别. 在接下来的任务中，将考虑根据任务多次迭代优化构建图结构信息，并对样本的局部信息和全局信息进行融合，通过样本的相似性动态捕获样本间的全局图结构信息.

参考文献 (33)

姓名
	姓名不能为空！
邮箱
	邮箱不能为空！非法的邮箱地址。
手机号码
	电话不能为空！请输入有效手机号!
标题
	标题不能为空！
留言内容
	内容不能为空！
验证码
	验证码不能为空！验证码错误！

留言板

自适应边缘样本识别的深度聚类算法

1.
山西大学大数据科学与产业研究院，太原 030006

2.
山西大学计算机与信息技术学院，太原 030006

3.
山西大学计算智能与中文信息处理教育部重点实验室，太原 030006

作者简介:
李俊霞，硕士研究生，主要从事图神经网络及数据挖掘研究 .

通讯作者: 钱宇华，教授，博士研究生导师;

Depth Clustering Algorithm for Adaptive Edge Samples Recognition

计量

自适应边缘样本识别的深度聚类算法

通讯作者: 钱宇华，教授，博士研究生导师;

English Abstract

Depth Clustering Algorithm for Adaptive Edge Samples Recognition

Corresponding author: QIAN Yuhua ;

全文HTML

2.1. 基本概念和术语

2.2. 样本表示学习

2.3. 样本结构信息

2.4. 簇中心样本和边缘样本划分(Auto-CB)

3.1. 数据集描述

3.2. 算法对比分析

3.3. 实现细节

3.4. 参数敏感性

3.4.1. K值影响分析

3.4.2. V值影响分析

3.5. 实验结果和分析

目录

留言板

自适应边缘样本识别的深度聚类算法

1. 山西大学 大数据科学与产业研究院，太原 030006 2. 山西大学 计算机与信息技术学院，太原 030006 3. 山西大学 计算智能与中文信息处理教育部重点实验室，太原 030006

作者简介: 李俊霞，硕士研究生，主要从事图神经网络及数据挖掘研究 .

通讯作者: 钱宇华，教授，博士研究生导师;

Depth Clustering Algorithm for Adaptive Edge Samples Recognition

计量

出版历程

自适应边缘样本识别的深度聚类算法

通讯作者: 钱宇华，教授，博士研究生导师;

English Abstract

Depth Clustering Algorithm for Adaptive Edge Samples Recognition

Corresponding author: QIAN Yuhua ;

全文HTML

2.1. 基本概念和术语

2.2. 样本表示学习

2.3. 样本结构信息

2.4. 簇中心样本和边缘样本划分(Auto-CB)

3.1. 数据集描述

3.2. 算法对比分析

3.3. 实现细节

3.4. 参数敏感性

3.4.1. K值影响分析

3.4.2. V值影响分析

3.5. 实验结果和分析

目录

1.
山西大学大数据科学与产业研究院，太原 030006

2.
山西大学计算机与信息技术学院，太原 030006

3.
山西大学计算智能与中文信息处理教育部重点实验室，太原 030006

作者简介:
李俊霞，硕士研究生，主要从事图神经网络及数据挖掘研究 .