留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

航空安全事件知识图谱补全方法

上一篇

下一篇

王红, 卢林燕, 王童. 航空安全事件知识图谱补全方法[J]. 西南大学学报(自然科学版), 2020, 42(11): 31-42. doi: 10.13718/j.cnki.xdzk.2020.11.004
引用本文: 王红, 卢林燕, 王童. 航空安全事件知识图谱补全方法[J]. 西南大学学报(自然科学版), 2020, 42(11): 31-42. doi: 10.13718/j.cnki.xdzk.2020.11.004
WANG Hong, LU Lin-yan, WANG Tong. The Method of Completing the Knowledge Graph of Aviation Safety Incidents[J]. Journal of Southwest University Natural Science Edition, 2020, 42(11): 31-42. doi: 10.13718/j.cnki.xdzk.2020.11.004
Citation: WANG Hong, LU Lin-yan, WANG Tong. The Method of Completing the Knowledge Graph of Aviation Safety Incidents[J]. Journal of Southwest University Natural Science Edition, 2020, 42(11): 31-42. doi: 10.13718/j.cnki.xdzk.2020.11.004

航空安全事件知识图谱补全方法

  • 基金项目: 国家重点实验室开放基金资助项目(SKLATM201902);国家自然科学基金项目(U1633110)
详细信息
    作者简介:

    王红(1963-),女,教授,主要从事研究语义数据挖掘与知识图谱研究 .

  • 中图分类号: TP391

The Method of Completing the Knowledge Graph of Aviation Safety Incidents

  • 摘要: 针对知识图谱稀疏实体间关系缺失和学习效率低的问题,提出了一种改进的知识图谱补全方法I_IterE(improved-iteratively learning embeddings and rules).首先,在IterE模型的表示学习层与规则学习层之间增加了特征层,采用add方法将表示学习层学到的关系特征进行增强,并生成新关系特征;然后,在规则学习层将新的关系特征与改进的评分机制相结合进行公理的分数计算,该分数用于判断公理的可信度;最后,利用高分公理进行演绎推理从而获得与稀疏实体相关的新三元组.采用公共数据集WN18-sparse,WN18RR-sparse,FB15k-sparse和FB15k-237-sparse进行链接预测和规则评估.实验结果表明,该方法在MRR、Hits@n和规则评估指标上均取得较好的提升,将该方法应用到航空安全事件数据集上,在显著提升链接预测效果的同时,为航空安全事件知识图谱的补全提供了方法支撑.
  • 加载中
  • 图 1  I_IterE模型框架

    图 2  特征增强过程

    图 3  航空安全事件知识图谱

    图 4  更新后的知识图谱

    表 1  OWL2对象属性表达公理及规则

    对象属性表达公理 规则形式
    ReflexiveOP(r) (xrx)
    SymmetricOP(r) (xry)→(yrx)
    TransitiveOP(r) (xry),(yrz)→(xrz)
    EquivalentOP(rr1) (xry)→(xr1,y)
    SubOP(rr1) (xry)→(xr1y)
    InverseOP(rr1) (yrx)→(xr1y)
    SubOP(OPChain(r1r2),r) (x0r1x1),(x1r2x2)→(x0rx2)
    下载: 导出CSV

    表 2  对象属性表达公理向量空间中的表示及结论

    对象属性表达公理 规则形式 线性映射 规则结论
    ReflexiveOP(r) (xrx) VxMr=Vx Mr=I
    SymmetricOP(r) (xry)→(yrx) VxMr=VyVyMr=Vx MrMr=I
    TransitiveOP(r) (xry),(yrz)→(xrz) VxMr=VyVyMr=VzVxMr=Vz MrMr=Mr
    EquivalentOP(rr1) (xry)→(xr1y) VxMr=VyVxMr1=Vy Mr=Mr1
    SubOP(rr1) (xry)→(xr1y) VxMr=VyVxMr1=Vy Mr=Mr1
    InverseOP(rr1) (yrx)→(xr1y) VyMr=VxVxMr1=Vy MrMr1=I
    SubOP(OPChain(r1r2),r) (x0r1x1),(x1r2x2)→(x0rx2) Vx0Mr1=Vx1Vx1Mr2=Vx2Vx0Mr=Vx2 Mr1Mr2=Mr
    下载: 导出CSV

    表 3  数据集统计信息

    Dataset WN18-sparse WN18RR-sparse FB15k-sparse FB15k-237-sparse
    #ent 40 943 40 943 14 951 14 541
    #rel 18 11 1 345 237
    #Train 141 442 86 835 483 142 272 115
    #Valid 3 624 1 609 18 544 10 671
    #Test 3 590 1 661 22 013 12 454
    下载: 导出CSV

    表 4  实验参数设置

    实验参数 WN18-sparse WN18RR-sparse FB15k-sparse FB15k-237-sparse
    d d=200 d=200 d=200 d=200
    λ λ=10-5 λ=10-4 λ=10-5 λ=10-4
    θ θ=0.9 θ=0.9 θ=0.9 θ=0.9
    lr lr=0.001 lr=0.001 lr=0.001 lr=0.001
    max_epoch max_epoch=100 max_epoch=150 max_epoch=100 max_epoch=150
    下载: 导出CSV

    表 5  WN18-sparse和FB15k-sparse上链接预测实验结果

    模型 WN18-sparse FB15k-sparse
    MRR Hits@ MRR Hits@
    Raw Filter 1 3 10 Raw Filter 1 3 10
    TransE 33.5 41.8 10.2 71.1 84.7 25.5 39.8 25.8 48.6 64.5
    DistMult 55.8 73.8 59.3 87.5 93.1 32.4 60.0 53.8 65.1 75.9
    ComplEx 67.7 91.1 89.0 93.3 94.4 32.7 61.6 54.0 65.7 76.1
    ANALOGY 67.5 91.3 89.0 93.4 94.4 33.1 62.0 54.3 66.1 76.3
    IterE 78.9 91.3 89.1 93.5 94.8 38.8 62.8 55.1 67.3 77.1
    I_IterE 80.0 92.5 91.1 95.0 96.7 40.1 63.8 56.5 68.8 79.1
    下载: 导出CSV

    表 6  WN18RR-sparse和FB15k-237-sparse上链接预测实验结果

    模型 WN18RR-sparse FB15k-237-sparse
    MRR Hits@ MRR Hits@
    Raw Filter 1 3 10 Raw Filter 1 3 10
    TransE 12.4 14.6 3.4 24.7 28.8 15.6 23.8 16.4 26.1 38.5
    DistMult 20.8 25.5 23.8 26.0 22.5 12.9 20.4 12.8 22.6 36.2
    ComplEx 21.4 25.9 24.6 26.2 28.6 13.3 19.7 12.0 21.7 35.4
    ANALOGY 13.3 19.8 24.6 27.5 28.7 13.9 19.8 12.3 21.4 34.9
    IterE 25.7 27.4 25.4 28.1 31.4 18.6 24.7 17.9 26.2 39.2
    I_IterE 27.0 28.9 27.1 30.5 34.5 20.0 26.6 20.1 28.6 42.8
    下载: 导出CSV

    表 7  规则评估实验结果

    模型 WN18-sparse WN18RR-sparse FB15k-sparse FB15k-237-sparse
    Time/s HQr 比例/% Time/s HQr 比例/% Time/s HQr 比例/% Time/s HQr 比例/%
    AMIE+ 4.98 16 11.4 3.0 2 5.71 428 1 820 4.4 66.00 470 1.9
    IterE 1.63 20 20.2 0.75 6 19.30 26.49 11 375 17.6 4.72 653 11.8
    I_IterE 1.17 25 23.6 0.52 8 27.60 14.03 18 876 23.2 2.35 831 17.2
    下载: 导出CSV

    表 8  航空安全事件数据集下的实验结果

    模型 MRR Hits@1 Hits@2 Hits@3
    IterE 44.0 37.8 48.5 53.8
    I_IterE 50.2 45.7 54.7 57.0
    下载: 导出CSV

    表 9  可能的公理集及得分情况

    可能的公理 公理得分
    SymmetricOP(subclassof,part_of) 0.9
    InverseOP(subclassof,haspart) 0.9
    InverseOP(cause_of,result_of) 0.9
    SubOP(OPChain(type_of,subclassof),is_a) 0.9
    SubOP(OPChain(is_a,haspart),type_of) 0.7
    下载: 导出CSV

    表 10  高分公理推演的新三元组情况

    高分公理 新三元组
    0.9SymmetricOP(subclassof,part_of) (沙赫乔斯特,part_of,事故地点)←(沙赫乔斯特,subclassof,事故地点)
    0.9InverseOP(subclassof,haspart) (航空器紧急事件,haspart,航空失事)←(航空失事,subclassof,航空器紧急事件)
    0.9InverseOP(cause_of,result_of) (山毛榉防空导弹击落,result_of,MH17)←(MH17,cause_of,山毛榉防空导弹击落)
    0.9SymmetricOP(subclassof,part_of) (航空受到非法干扰,part_of,航空器紧急事件)←(航空受到非法干扰,subclassof,航空器紧急事件)
    0.9SymmetricOP(subclassof,part_of) (航空器紧急事件,part_of,事故灾害类)←(航空器紧急事件,subclassof,事故灾害类)
    0.9InverseOP(subclassof,haspart) (事故灾害类,haspart,航空器紧急事件)←(航空器紧急事件,subclassof,事故灾害类)
    0.9SubOP(OPChain(type_of,subclassof),is_a) (MH17,is_a,航空器紧急事件)←(MH17,type_of,航空器失事),(航空器失事,subclassof,航空器紧急事件)
    下载: 导出CSV
  • [1] 徐增林, 盛泳潘, 贺丽荣, 等.知识图谱技术综述[J].电子科技大学学报, 2016, 45(4): 589-606. doi: http://www.cnki.com.cn/Article/CJFDTotal-DKDX201604012.htm
    [2] 王鑫, 邹磊, 王朝坤, 等.知识图谱数据管理研究综述[J].软件学报, 2019, 30(7): 2139-2174. doi: http://www.cnki.com.cn/Article/CJFDTotal-RJXB201907016.htm
    [3] FELLBAUM, C, MILLER, G. WordNet : an electronic lexical database[M]. WordNet: An Electronic Lexical Database. Cambridge: MIT Press, 1998.
    [4] BOLLACKER K, EVANS C, PARITOSH P, et al. Freebase: a Collaboratively Created Graph Database for Structuring Human Knowledge[C]//Proceedings of the 2008 ACM SIGMOD International Conference on Management of Data. Vancouver : ACM Press, 2008: 1247-1250.https://dl.acm.org/doi/10.1145/1376616.1376746
    [5] SUCHANEK F M, KASNECI G, WEIKUM G. Yago: a Core of Semantic Knowledge[C]//Proceedings of the 16th international conference on World Wide Web. Banff, Alberta: ACM Press, 2007: 697-706.https://dl.acm.org/doi/10.1145/1242572.1242667
    [6] 饶子昀, 张毅, 刘俊涛, 等.应用知识图谱的推荐方法与系统[J/OL].自动化学报: 1-17[2020-09-28]. https://doi.org/10.16383/j.aas.c200128.
    [7] 蔡泽胤.基于平移模型的知识图谱补全算法研究[D].武汉: 华中科技大学, 2019.
    [8] 崔员宁, 李静, 沈力, 等. Duration-HyTE:基于持续时间建模的时间感知知识表示学习方法[J].计算机研究与发展, 2020, 57(6): 1239-1251.
    [9] BORDES A, USUNIER N, GARCIA-DURáN A, et al. Translating Embeddings for Modeling Multi-Relational Data[C]//NIPS'13: Proceedings of the 26th International Conference on Neural Information Processing Systems-Volume 2. Red Hook: Curran Associates Inc, 2013: 2787-2795.
    [10] WANG Z, ZHANG J W, FENG J L, et al. Knowledge Graph Embedding by Translating on Hyperplanes[C]//AAAI'14: Proceedings of the Twenty-Eighth AAAI Conference on Artificial Intelligence. Québec: AAAI Press, 2014: 1112-1119.
    [11] LIN Y, LIU Z, SUN M, et al. Learning Entity and Relation Embeddings for Knowledge Graph Completion[C]//AAAI'15: Proceedings of the Twenty-Ninth AAAI Conference on Artificial Intelligence. Austin, Texas: AAAI Press, 2015: 2181-2187.
    [12] JI G L, HE S Z, XU L H, et al. Knowledge Graph Embedding via Dynamic Mapping Matrix[C]//Proceedings of the 53rd Annual Meeting of the Association for Computational Linguistics and the 7th International Joint Conference on Natural Language Processing (Volume 1: Long Papers), Beijing : Association for Computational Linguistics, 2015: 687-696.
    [13] YANG B S, YIH W T, HE X D, et al. Embedding Entities and Relations for Learning and Inference in Knowledge Bases[EB/OL].[2014-10-27]. https://arxiv.org/abs/1412.6575v2.
    [14] TROUILLON T, WELBL J, RIEDEL S, et al. Complex Embeddings for Simple Link Prediction[C]//ICML'16: Proceedings of the 33rd International Conference on International Conference on Machine Learning-Volume 48. New York: JMLR org, 2016: 2071-2080.
    [15] LIU H X, WU Y X, YANY Y. Analogical Inference for Multi-Relational Embeddings[C]//ICML'17: Proceedings of the 34th International Conference on Machine Learning-Volume 70. Sydney: JMLR Org, 2017: 2168-2178.
    [16] 胡卓.面向知识图谱的表示学习算法的研究与应用[D].成都: 电子科技大学, 2020.
    [17] doi: https://link.springer.com/content/pdf/10.1007%2Fs10994-010-5205-8.pdf LAO N, COHEN W W. Relational Retrieval Using a Combination of Path-Constrained Random Walks[J]. Machine Learning, 2010, 81(1): 53-67.
    [18] LAO N, MITCHELL T M, COHEN W W, et al. Random Walk Inference and Learning in A Large Scale Knowledge Base[C]//EMNLP'11: Proceedings of the Conference on Empirical Methods in Natural Language Processing. Edinburgh: Association for Computational Linguistics, 2011: 529-539.
    [19] GALARRAGA A L, TEFLIOUDI C, HOSE K, et al. AMIE: Association Rule Mining under Incomplete Evidence in Ontological Knowledge Bases[C]//WWW'13: Proceedings of the 22nd International Conference on World Wide Web. New York: Association for Computing Machinery, 2013: 413-422.
    [20] GALÁRRAGA L, TEFLIOUDI C, HOSE K, et al. Fast Rule Mining in Ontological Knowledge Bases with AMIE+[J]. The VLDB Journal, 2015, 24(6): 707-730. doi: 10.1007/s00778-015-0394-1
    [21] 官赛萍, 靳小龙, 贾岩涛, 等.面向知识图谱的知识推理研究进展[J].软件学报, 2018, 29(10): 2966-2994. doi: http://www.cnki.com.cn/Article/CJFDTotal-RJXB201810006.htm
    [22] ZHANG W, PAUDEL B, WANG L, et al. Iteratively Learning Embeddings and Rules for Knowledge Graph Reasoning[C]//WWW'19: The World Wide Web Conference. New York: Association for Computing Machinery, 2019: 2366-2377.
    [23] 王红, 李晗, 李浩飞.民航突发事件领域本体关系提取方法的研究[J].计算机科学与探索, 2020, 14(2): 285-293.
    [24] 王红, 李浩飞, 邸帅.民航突发事件实体识别方法研究[J].计算机应用与软件, 2020, 37(3): 166-172.
    [25] XIE S, TU Z. Holistically-Nested Edge Detection[C]//2015 IEEE International Conference on Computer Vision(ICCV). Santiago: IEEE, 2015: 1395-1403.
    [26] HAJEK P. Towards Metamathematics of Weak Arithmetics over Fuzzy Logic[J]. Logic Journal of IGPL, 2011, 19(3): 467-475. doi: 10.1093/jigpal/jzp091
    [27] KINGMA D, BA J. Adam: A Method for Stochastic Optimization[EB/OL].[2014-10-24]. https://arxiv.org/abs/1412.6980v1.
    [28] 冯兴杰, 曾云泽.基于评分矩阵与评论文本的深度推荐模型[J].计算机学报, 2020, 43(5): 884-900. doi: http://www.cnki.com.cn/Article/CJFDTotal-JSJX202005008.htm
  • 加载中
图( 4) 表( 10)
计量
  • 文章访问数:  5998
  • HTML全文浏览数:  5998
  • PDF下载数:  549
  • 施引文献:  0
出版历程
  • 收稿日期:  2020-10-14
  • 刊出日期:  2020-11-20

航空安全事件知识图谱补全方法

    作者简介: 王红(1963-),女,教授,主要从事研究语义数据挖掘与知识图谱研究
  • 中国民航大学 计算机科学与技术学院,天津 300300
基金项目:  国家重点实验室开放基金资助项目(SKLATM201902);国家自然科学基金项目(U1633110)

摘要: 针对知识图谱稀疏实体间关系缺失和学习效率低的问题,提出了一种改进的知识图谱补全方法I_IterE(improved-iteratively learning embeddings and rules).首先,在IterE模型的表示学习层与规则学习层之间增加了特征层,采用add方法将表示学习层学到的关系特征进行增强,并生成新关系特征;然后,在规则学习层将新的关系特征与改进的评分机制相结合进行公理的分数计算,该分数用于判断公理的可信度;最后,利用高分公理进行演绎推理从而获得与稀疏实体相关的新三元组.采用公共数据集WN18-sparse,WN18RR-sparse,FB15k-sparse和FB15k-237-sparse进行链接预测和规则评估.实验结果表明,该方法在MRR、Hits@n和规则评估指标上均取得较好的提升,将该方法应用到航空安全事件数据集上,在显著提升链接预测效果的同时,为航空安全事件知识图谱的补全提供了方法支撑.

English Abstract

  • 知识图谱(knowledge graph)是一种揭示实体之间关系的语义网络,可以对现实世界的事物及其相互关系进行形式化地描述[1],一般表示为三元组(头实体、关系、尾实体)的形式[2].如WordNet[3],Freebase[4]和YAGO[5]等将知识图谱广泛应用于问答系统、智能搜索和个性推荐等领域,但是很多大型开放知识图谱都是由人工或半自动的方式构建的,这些图谱通常比较稀疏,大量实体之间隐含的关系未被充分挖掘出来[6],因此知识图谱的补全方法成为新的研究热点.

    表示学习是实现知识图谱补全的有效方法,它将知识图谱的实体和关系映射到连续的向量空间,利用向量计算方式推出实体之间潜在的语义关系,使得计算复杂度降低[7].表示学习中常用的两个模型是翻译模型和线性模型[8],其中翻译模型包括TransE模型[9]和基于TransE的一系列改进模型,如TransH模型[10]、TransR模型[11]和TransD模型[12]等.线性模型包括DistMult模型[13]、ComplEx模型[14]和ANALOGY模型[15]等,线性模型还具有良好的规则学习属性.但这两种模型对具有较少关系的实体(稀疏实体)表示效果较差[16],因为好的表示依赖于丰富的知识.规则学习也是知识图谱补全的重要手段,主要利用规则的演绎能力进行关系推演,可以保证结果的可靠性和可解释性.规则学习包括基于随机行走的规则挖掘[17-18]、知识图谱关联规则挖掘算法AMIE[19]及改进的AMIE+[20]等基于图结构的规则学习方法.这些方法虽然在结构上加快了推理速度[21],一定程度上缓解了规则学习的高复杂问题,但是仍存在规则搜索空间大、无法较好评估规则和仅考虑知识图谱结构等问题.

    2019年,Zhang等人[22]提出了IterE模型,首次利用具有丰富语义OWL2中的对象属性表达公理进行演绎推理,有效提升了稀疏实体的表示效果和规则学习的效率.但该模型仅包含表示学习层和规则学习层,其泛化能力较弱,且模型中所采用的Frobenius范数计算方式复杂、无法显著区分高分公理.在航空安全事件知识图谱的研究方面,王红等人[23-24]研究了民航突发事件实体与关系的自动抽取方法,初步解决了航空安全事件知识图谱的构建问题,但未充分考虑实例层和概念层(本体)内稀疏实体之间隐含的语义关系.

    为此,本研究提出一种改进的知识图谱补全方法(I_IterE),通过增加特征层和改进的评分机制获得高分公理进行演绎推理,旨在更好地利用高分公理进行演绎推理和链接预测,实现航空安全事件知识图谱的进一步补全,为基于知识图谱的航空安全事件语义分析提供更好的数据支持.

  • IterE模型包括表示学习层和规则学习层,通过表示学习层获得的关系特征,结合规则学习层挖掘的公理集,采用相应的评分机制获得高分公理进行演绎推理.为了提升模型的泛化能力和规则学习的效率,本研究提出的改进模型I_IterE(图 1). 图 1中:

    (1) 表示学习层  利用线性模型将知识图谱中的实体和关系映射到向量空间中.

    (2) 特征增强层  对表示学习层的关系特征利用add[25]方法对关系特征叠加从而增强特征.

    (3) 规则学习层  将生成的公理集与增强后的关系特征采用改进的评分机制对公理进行评分,获得高分公理进行演绎推理,从而实现知识图谱的更新.

  • 知识图谱可以描述为G={ERT},其中E为实体的集合,R为关系的集合,T={(hrt)|htErR}为三元组的集合.在三元组(hrt)中,hrt分别为头实体,关系和尾实体.表示学习层的输入集I表示为:

    其中:lhrt是三元组的标签,用以评估三元组的可靠性;Taxiom是规则学习层生成的三元组;Tnegative是通过将(hrt)∈Tht随机替换为eE或者将r替换为rR生成的负样本集.

    若(hrt)∈T,则lhrt=1;若(hrt)∈Tnegative,则lhrt=0;若(hrt)∈Taxiom,则lhrt=π(hrt).其中π(hrt)是由公理演绎预测的标签值.

    对于输入集I,采用交叉熵作为损失函数,即如

    其中:n表示输入的三元组数量,φ(hrt)采用线性模型中表现较好的ANALOGY模型的得分函数,表示为

    其中:Vh${{\mathbb{R}}^{1\times d}} $Vt${{\mathbb{R}}^{1\times d}} $ht的向量表示,Mr${{\mathbb{R}}^{d\times d}} $r的矩阵表示,d是表示维度,σ是sigmoid函数.

    经过表示学习层之后,可得到实体特征的集合ε和关系特征集合$\mathbb{R} $.

  • 由于公理的评估以关系特征为基础,而演绎推理主要依据高分公理,因此关系特征具有重要意义.

    泛化能力是指模型对于新鲜样本(测试集)的预测能力,提升模型泛化能力的方法包括使用更多的数据、数据过采样、修改损失函数、改进模型深度和权重惩罚等,本研究采用改进模型深度的方法,通过增加特征层来提升模型泛化能力.

    特征增强的具体过程:以某一公理包括M1M2两个关系特征的公理为例,为避免不同语义信息的关系特征混杂产生噪音影响公理的评估,采用add方法[25]对关系特征进行特征增强.如图 2所示,add方法将关系特征中元素对应相加,并且相加后特征维度不变,只是每一维下的信息量在增加,进而增强语义信息较强的区域,通过特征重用提升最终的链接预测结果.其中,关系特征层数的选择通过链接预测的结果来确定,层数为3层时可使模型链接预测结果达到最佳.由于ANALOGY模型获得的关系特征对角相等,经特征增强后仍相等,因而仅根据关系特征的某一对角的相关值进行计算即可,利用Python中的split函数对增强后的关系特征进行分块(分片)处理,可以获得代表整个特征的块对角特征,极大降低计算复杂度.

  • 规则学习层包括公理集生成、改进的评分机制和演绎推理三部分.首先依据OWL2的7种对象属性表达公理挖掘出知识图谱中存在的公理集,之后结合特征增强层的关系特征和改进的评分机制对各公理进行评分计算,最后根据高分公理进行演绎推理.

  • OWL2中7种对象属性表达公理见表 1所述.

    表 1中,rr1r2表示关系变量,xx0x1x2yz表示实体变量.

    将知识图谱每个关系γR生成图谱中可能存在的公理主要分为3个步骤.

    步骤1:生成带关系变量的公理ReflexiveOP(γ),SymmetricOP(γ),TransitiveOP(γ),EquivalentOP(γr),SubOP(γr),InverseOP(γr)和SubOP(OPChain(rr),γ),其中{rr}需用知识图谱中实际关系来替换的关系变量.

    步骤2:知识图谱中随机选择与γ有关的k个三元组(eγe)∈T,将直接链接到e或者e的关系替换步骤1公理中的rr,从而具体化步骤1的公理.

    其中k应尽可能小,并使公理集能覆盖所有可能公理的概率高于公理覆盖阈值,k的约束条件为

    其中:N是三元组(eγe)∈T的数目,p为最小公理概率,存在概率大于p的公理为高可能性公理,t为公理覆盖阈值.因此在固定的pt的情况下,k的最佳选择应该是方程$f\left( N \right)=N-N{{\left( 1-t \right)}^{\frac{1}{{{p}^{N}}}}} $的上限.

    步骤3:在知识图谱中查找并统计每个公理的支持数,将支持数大于等于1的公理添加到公理集Ω.

    由于输入的知识图谱是固定的,因此公理集Ω仅需生成一次.

  • 在评分处理之前,首先将表 1中的规则用表示学习层学到的实体特征和关系特征进行表示,并归纳得出相关规则结论(表 2).

    例如,对于公理InverseOP(hasWife,hasHusband),如果知识图谱中存在(Carl,hasWife,Mary),根据表 1的规则,可以推出另一个三元组(Mary,hasHusband,Carl).假设Mary,Carl,hasWife和hasHusband的表示分别为VMaryVCarlMhasWifeMhasHusband,对于上述两个三元组,根据线性映射假设,可得到两个等式:VCarlMhasWife=VMaryVMaryMhasHusband=VCarl.依据上述等式可推出:MhasWifeMhasHusband=I,其中I表示单位矩阵,该等式表明仅与两个对应的关系特征有关,与具体的实体特征无关,因此可将其视为公理InverseOP(hasWife,hasHusband)的一般结论. 表 2给出了每个公理规则结论的详细信息.

    表 2VM分别表示实体特征和关系特征,I是单位矩阵.

    给定关系特征的集合$ \mathbb{R}$和公理集Ω,评分机制是基于每个公理类型的规则结论为公理aΩ计算得分.以M1a=M2a的形式来表示规则结论,其中M1aM2a是单个关系特征或两个关系特征相乘后的特征.由于规则结论是从理想的线性映射中得到的,但表示学习层学到的关系特征各不相同.因此,通过比较M1aM2a之间的相似性对公理a进行评分.

    IterE模型采用Frobenius范数进行评分,其计算公式为

    其中:d表示关系特征M1aM2a的维度.表示学习层经ANALOGY方法学习后关系特征对角块矩阵相同,因此在(5)式中重复计算对角块特征,目的是增大关系特征之间相似与不相似的差距.但关系特征中各值均在[-0.01,0.01]范围内,关系特征之间的差距经平方后会被大幅度缩小,从而无法较好过滤低分公理.为此,改进评分公式为

    其中:F表示改进的Frobenius范数,sa(F)表示通过改进的Frobenius范数计算出公理a的得分. (6)式将(5)式中的平方换成常量线性乘法,因为在[-0.01,0.01]范围内,常量线性乘法比平方更能较好地增大高分公理与低分公理的差距,利于筛选,进而有效进行演绎推理.但是因不同类型的公理sa(F)值变化很大,因此需将sa(F)归一化,等到

    其中:t是公理a所属的公理类别,smax(t)和smin(t)是公理集Ω中所有类型t的最大和最小得分. sa∈[0, 1]是公理a的最终得分,sa越高,公理a的可信度越高.

  • 给定知识图谱G和公理集Ω,首先利用公理的演绎能力推出新三元组,并预测其标签,然后过滤掉与稀疏实体无关的三元组,最后将Taxiom更新到知识图谱中.

    利用公理的基本形式进行演绎推理,如公式(8)所示.

    其中(hiriti)∈Ti∈[1,n]而(harata)∉T需添加到知识图谱中.为了预测(harata)的标签,首先将(8)式转换为

    基于t范数的模糊逻辑[26]对公式(9)进行计算,例如(h1r1t1)⇒(h2r2t2)的标签由三元组(h1r1t1)和(h2r2t2)的标签确定,这是通过逻辑表示符号⇒定义,且遵循逻辑与、或和非的逻辑定义:

    其中:bc是逻辑表达,π(x)是x的标签.基于上述条件,可通过(10)-(13)式计算任何规则的标签.例如ga:(h1r1t1)∧(h2r2t2)⇒(harata):

    因此,可得到

    将(7)式计算的公理a的得分sa作为ga的标签,即π(ga)=sa.知识图谱中存在的三元组标签依据表示学习层的标签进行标记.若(hrt)∈T,则π(hrt)=1.因此,对于任何类型的公理a,可知三元组(harata)的标签为:

    通过高分公理推出一组新三元组的集合Taxiom={(harata)|haEsparse or taEsparse},其中Esparse表示知识图谱的稀疏实体的集合.实体的稀疏性为

    其中:f(e)是实体作为头实体或尾实体出现在图谱中的频率,fmaxfmin是所有实体里出现在图谱中的最大和最小频率. r(e)∈[0, 1],若r(e)=0,则表示e是图谱中出现最频繁的实体;若r(e)=1,则表示e是图谱中出现频率最小的实体.当r(e)>θsparsity,将实体e作为稀疏实体,其中θsparsity是稀疏阈值.以此推出所有可能的新三元组后,并过滤掉与稀疏实体无关的三元组,可以实现知识图谱的更新.

  • 实验采用WN18-sparse,WN18RR-sparse,FB15k-sparse和FB15k-237-sparse数据集[22],它们是由知识图谱补全常用的公开数据集WN18和FB15k生成的[17]. 表 3中给出了各数据集的实体、关系、训练集、验证集和测试集的数量.

    表示学习层采用均匀分布U(-0.01,0.01)初始化实体和关系.规则学习层中的最小公理概率一般取p=0.5,公理覆盖阈值t=0.95,由(4)式可知每个关系选择的相关三元组的数量设置为k=6.对于公理演绎,评分高的公理更可靠且不易产生噪声,因此为每个数据集设置阈值θ为0.9,并将saxiom≥θ的公理作为高分公理.

    对于WN18-sparse和FB15k-sparse,最大训练迭代次数设置为100,而WN18RR-sparse和FB15k-237-sparse的最大训练迭代次数设置为150.采用Adam优化器[27],其优势能够在训练过程中自动调整恰当的学习率,使得模型能够较快收敛,并适用于解决包含高噪声或稀疏梯度的问题[28].结合表示维度d∈(100,200)和L1正则化权重λ∈{10-4,10-5,10-6},最终在验证集中表现最好的实验参数见表 4.

  • 链接预测是对知识图谱中的实体或关系进行预测.链接预测实验采用平均倒数排名(MRR)的原始设置和过滤设置,Hits@1,Hits@3和Hits@10在过滤设置情况下的得分作为模型性能评价指标,通常较高的MRR或Hits@n表示具有较好的预测效果.

    对比模型考虑了表示学习方法中翻译模型的经典模型TransE和线性模型DistMult,ComplEx,ANALOGY以及基础模型IterE. WN18-sparse,WN18RR-sparse,FB15k-sparse和FB15k-237-sparse在不同方法上的链接预测结果见表 5表 6.

    表 5表 6可知,在各个数据集上,I_IterE的链接预测结果均高于其他模型,并且与模型IterE相比,在Hits@1,Hits@3和Hits@10指标上,最低高出了1.0%,最高高出了3.4%,达到了较好的实验效果.表明增加特征层和改进的评分机制,有效提升了模型的链接预测效果.

  • 规则学习的效率通过学习的时间评估,而规则学习的质量通过高质量规则(HQr)的数量及其所占挖掘出的所有规则的比例(%).规则的质量通常使用头覆盖率(HC)进行评估.对于规则rule的头覆盖率定义如公式(16)所示.

    其中head(rule)(ee)={(ere)∈Tsupport(rule)是rule的支持度,并且将HC>0.7的规则视为高质量规则.

    对比模型为规则学习中效果较好的AMIE+[20]和基础模型IterE[22],规则评估结果见表 7.

    表 7可知,I_IterE模型的规则学习效率均优于IterE模型和AMIE+模型,同时高质量的规则数量增加.实验结果表明,评分公式中的平方替换为常量线性乘法,降低了计算复杂度,筛选出较多的高质量规则.

  • 航空安全事件知识图谱的数据集来自航空安全事故调查报告2007-2020年的1 879个航空安全事件,共提取出8 830个实体、32种关系和20 000个三元组.将三元组按6:2:2比例分别抽取到训练集、测试集和验证集中.参照公共数据集的实验设置进行实验,选出在验证集中表现最好的链接预测结果.

  • 步骤1:采用均匀分布U(-0.01,0.01)向量初始化表示航空安全事件知识图谱的实体和关系,再经ANALOGY模型训练得到较好表示知识图谱的实体特征的集合和关系特征的集合.

    步骤2:按照1.2节所述方法,对知识图谱的关系特征进行特征增强,之后利用Python的split函数对新关系特征进行分块(分片)处理.

    步骤3:依据OWL2的7种对象属性表达公理,按照1.3.1节的3个步骤挖掘航空安全事件知识图谱中可能存在的公理集.

    步骤4:结合步骤2获得的关系特征和步骤3的公理集,采用1.3.2节改进的评分机制对各公理进行评分并归一化.

    步骤5:从步骤4中筛选出大于等于0.9的高分公理推演出新三元组并根据公式(14)对三元组进行标记,并将新三元组中实体属于稀疏实体的保留,反之过滤.最后更新航空安全事件知识图谱.

  • 将I_IterE模型应用于航空安全事件数据集进行链接预测,并通过MRR和Hits@n来反映实验效果,使用IterE模型与I_IterE模型进行比较,实验结果见表 8.

    表 8可知,在航空安全事件数据集上,I_IterE模型的链接预测结果相比于IterE模型均有显著提高,表明I_IterE模型利于航空安全事件知识图谱的补全.针对航空安全事件知识图谱补全效果进行分析,如下所述.

    首先,表示学习层需输入航空安全事件知识图谱(图 3).

    其次,依据OWL2的7种对象属性表达公理生成可能的公理集,并结合增强后的关系特征与改进的评分机制对公理进行评分(表 9).

    最后,基于得分大于等于0.9的公理推演出新三元组见表 10,加黑的三元组表示新三元组,并将其更新到知识图谱(图 4),虚线箭头表示新添加的两实体间存在的语义关系.

  • 本研究提出了一种改进的知识图谱补全方法(I_IterE),通过增加模型深度且改进评分机制,有效提升了链接预测的准确率和规则学习的效率,在获得较多高质量规则实现推理的同时,进一步提高了模型的泛化能力.将该方法应用于航空安全事件数据集,较好地解决了航空安全事件知识图谱的补全问题.未来围绕OWL2的数据属性表达公理和类属性表达公理,可以进一步研究知识图谱补全的优化方法.

参考文献 (28)

目录

/

返回文章
返回