-
开放科学(资源服务)标志码(OSID):
-
社区发现(Community Discovery)是将复杂网络拓扑结构分解为有意义的节点集群的任务[1]. 目前主流的社区发现方法基于聚类计算,通过无监督学习训练发现共同群体[2-3]. 然而,由于现有网络节点属性不同,对于社区的定义各种各样,聚类结果带有一定的随机性,不能实现精准分类[4]. 另一方面,现有划分算法只关注平面数据,没有充分利用个体和链接属性信息的语义,导致划分不准确[5-6]. 同时,当前社区发现算法主要通过将有向图转化为无向图来进行社区发现,此过程可能丢失很多细节导致社区结果划分不准确. 为实现对节点关系的准确描述,在社区网络中加入有向性[7],通过描述不同种类的链接,可以更真实模拟社交网络等现实世界网络.
Satuluri算法[8]与LSW-OCD算法[9]都是根据节点的矢量将有向图转化为带方向权值的无向图,虽然Satuluri算法的复杂度已经在LSW-OCD得到较大改善,但节点中隐含着的语义与语义的关系却没有在算法中发挥作用. 语义研究不仅关注事物概念的含义,还关注含义间的关系. 在社会网络中,用户的行为都与用户本身的特征、爱好、习惯等紧密相连. 社区发现中语义的引入,为挖掘非数据信息提供了可能,从而支持对网络社区更精确地划分. 基于语义对社区发现的应用潜力,本文提出以语义推理为基础的网络社区发现模型.
Semantic Link Based Cyber Community Discovery Model
-
摘要: 网络社区作为新的资源发布和共享方式,其形成模式、发现方式等是网络发展研究热点之一. 由于聚类的随机性以及现有划分算法对个体和链接属性信息的语义利用不充分,社会网络的社区不能得到准确的分类. 本文提出基于语义推理的网络社区发现模型,通过节点关系的拓扑结构和节点间的语义联系,抽取多层语义进行搜索并进行社区发现. 在ego-Facebook数据集上的实验结果表明,当社区大小增长到1 000以后,本算法更加稳定,更适用于节点包含丰富的语义且结构稀疏的网络.Abstract: As a new way of publishing and sharing resources, the network community is one of the hot spots in the research of network growth. Due to the randomness of clustering and the insufficient semantic utilization of individual node as well as link attributes by existing partitioning algorithms, communities in social networks cannot achieve satisfied classifications. This paper proposed a network community discovery model based on semantic reasoning, which extracts multi-layer semantics through the topology of network and the semantic connections between nodes. Experiment results on the ego-Facebook dataset show that the algorithm is more stable and more suitable for networks with rich semantics and sparse structure when the community size grows to more than 1 000.
-
Key words:
- community discovery /
- semantic network /
- semantic chain /
- multilayer model /
- knowledge map .
-
表 1 语义链接网络的推理规则
推理规则 注释 1 Pi-Equ→Pi - 2 Pi-Equ→Pj Pj-Equ→Pj 3 Pi-Equ→Pj,Pj-Equ→Pk Pi-Equ→Pk 4 Pi-Equ→Pj,Pj-Sim→Pk Pi-Sim→Pk 5 Pi-Imp→Pj,Pj-Imp→Pk Pj-Imp→Pk 6 Pi-Sub→Pj,Pj-Sub→Pk Pj-Sub→Pk 7 Pi-Imp→Pj,Pj-Sub→Pk Pj-Imp→Pk 8 Pi-Imp→Pj,Pj-Ref→Pk Pj-Ref→Pk 9 Pi-Sub→Pj,Pj-Imp→Pk Pj-Imp→Pk 10 Pi-Sub→Pj,Pj-Ref→Pk Pj-Ref→Pk 11 Pi-Non→Pj,Pj-Sim→Pk Pj-Non→Pk 12 Pi-Ø→Pj,Pj-Sim→Pk Pj-Non→Pk 表 2 函数及其注释
函数 注释 Peer (Ni) 语义节点Ni的语义映射节点 Root(Ni) 语义节点Ni的根节点 Length (Ni,Nj) 语义节点Ni到Nj路径上节点的个数 Max-Semantic-Clique(Ni,Nj) 包括语义节点Ni与Nj的最大语义群 Min-Common-Sub-Tree(Ni,Nj) 包括语义节点Ni的最小公共子树 Semantic-Node-Similarity-Degrees (Ni,Nj) 语义节点Ni与Nj之间的相似度 -
[1] CLAUSET A, NEWMAN M E J, MOORE C. Finding Community Structure in very Large Networks[J]. Physical Review E, Statistical, Nonlinear, and Soft Matter Physics, 2004, 70(6): 066111. doi: 10.1103/PhysRevE.70.066111 [2] LI W M, ZHOU X K, YANG C, et al. Multi-Objective Optimization Algorithm Based on Characteristics Fusion of Dynamic Social Networks for Community Discovery[J]. Information Fusion, 2022, 79: 110-123. doi: 10.1016/j.inffus.2021.10.002 [3] NAIK D, RAMESH D, GANDOMI A H, et al. Parallel and Distributed Paradigms for Community Detection in Social Networks: a Methodological Review[J]. Expert Systems With Applications, 2022, 187: 115956. doi: 10.1016/j.eswa.2021.115956 [4] 端祥宇, 袁冠, 孟凡荣. 动态社区发现方法研究综述[J]. 计算机科学与探索, 2021, 15(4): 612-630. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-KXTS202104002.htm [5] YANG Z L, ZHANG W J, YUAN F, et al. Measuring Topic Network Centrality for Identifying Technology and Technological Development in Online Communities[J]. Technological Forecasting and Social Change, 2021, 167: 120673. doi: 10.1016/j.techfore.2021.120673 [6] 阎海玲. 复杂网络社区发现方法综述[J]. 信息与电脑(理论版), 2018(20): 162-163, 169. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-XXDL201820067.htm [7] 陈洒然. 面向社会网络的网络抽样与统计推断方法研究[D]. 长沙: 国防科技大学, 2018. [8] SATULURI V, PARTHASARATHY S. Symmetrizations for Clustering Directed Graphs[C] //EDBT/ICDT'11: Proceedings of the 14th International Conference on Extending Database Technology. 2011: 343-354. [9] 张海燕, 梁循, 周小平. 针对有向图的局部扩展的重叠社区发现算法[J]. 数据采集与处理, 2015, 30(3): 683-693. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-SJCJ201503025.htm [10] BERNERS-LEE T, HENDLER J, LASSILA O. The Semantic Web[J]. Scientific Aamerican, 2001, 284(5): 34-43. doi: 10.1038/scientificamerican0501-34 [11] 谭荧, 张进, 夏立新. 语义网络发展历程与现状研究[J]. 图书情报知识, 2019(6): 102-110. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-TSQC201906013.htm [12] ANTONIOU G, HARMELEN F. 语义网基础教程[M]. 陈小平, 译. 北京: 机械工业出版社, 2008. [13] 黄恒琪, 于娟, 廖晓, 等. 知识图谱研究综述[J]. 计算机系统应用, 2019, 28(6): 1-12. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-XTYY201906001.htm [14] 庞美玉. 基于TAP的上下文知晓框架研究[D]. 太原: 太原理工大学, 2006.