航空安全事件知识图谱补全方法

王红; 卢林燕; 王童

doi:10.13718/j.cnki.xdzk.2020.11.004

航空安全事件知识图谱补全方法

中国民航大学计算机科学与技术学院，天津 300300

基金项目: 国家重点实验室开放基金资助项目(SKLATM201902)；国家自然科学基金项目(U1633110)

详细信息

作者简介:
王红(1963-)，女，教授，主要从事研究语义数据挖掘与知识图谱研究 .

中图分类号: TP391

The Method of Completing the Knowledge Graph of Aviation Safety Incidents

School of Computer Science and Technology, Civil Aviation University of China, Tianjin 300300, China

摘要: 针对知识图谱稀疏实体间关系缺失和学习效率低的问题，提出了一种改进的知识图谱补全方法I_IterE(improved-iteratively learning embeddings and rules).首先，在IterE模型的表示学习层与规则学习层之间增加了特征层，采用add方法将表示学习层学到的关系特征进行增强，并生成新关系特征；然后，在规则学习层将新的关系特征与改进的评分机制相结合进行公理的分数计算，该分数用于判断公理的可信度；最后，利用高分公理进行演绎推理从而获得与稀疏实体相关的新三元组.采用公共数据集WN18-sparse，WN18RR-sparse，FB15k-sparse和FB15k-237-sparse进行链接预测和规则评估.实验结果表明，该方法在MRR、Hits@n和规则评估指标上均取得较好的提升，将该方法应用到航空安全事件数据集上，在显著提升链接预测效果的同时，为航空安全事件知识图谱的补全提供了方法支撑.
- 知识图谱 /
- 关系特征 /
- 评分机制 /
- 链接预测 /
- 规则评估 /
- 航空安全事件
Abstract: In view of the lack of relationship between sparse entities and low learning efficiency of knowledge graphs, an improved knowledge graph completion method, I_IterE (Improved- Iteratively learning embeddings and rules), is proposed in this paper. First, a feature layer is added between the representation learning layer and the rule learning layer of the IterE model, which uses the add method to enhance the relationship features learned by the representation learning layer and generates new relationship features. Then, in the rule learning layer, the new relational features are combined with the improved scoring mechanism to calculate the score of axioms, which is used to judge the credibility of the axioms. Finally, the high resolution axioms are used for deductive reasoning to obtain new triples related to sparse entities. The public datasets WN18-sparse, WN18RR-spars, FB15k-sparse and FB15k-237-sparse are used for link prediction and rule evaluation. Experimental results show that the method described in this paper has achieved good improvement in MRR, Hits@n and rule evaluation. This method is applied to the dataset of aviation safety incidents. While significantly improving the effect of link prediction, it also provides a method support for completing the knowledge graph of aviation safety incidents.
- knowledge graph /
- relationship feature /
- scoring mechanism /
- link prediction /
- rule evaluation /
- aviation safety incidents .

图 1 I_IterE模型框架

下载: 全尺寸图片幻灯片

图 2 特征增强过程

下载: 全尺寸图片幻灯片

图 3 航空安全事件知识图谱

下载: 全尺寸图片幻灯片

图 4 更新后的知识图谱

下载: 全尺寸图片幻灯片

表 1 OWL2对象属性表达公理及规则

对象属性表达公理	规则形式
ReflexiveOP(r)	(x，r，x)
SymmetricOP(r)	(x，r，y)→(y，r，x)
TransitiveOP(r)	(x，r，y)，(y，r，z)→(x，r，z)
EquivalentOP(r，r₁)	(x，r，y)→(x，r₁，y)
SubOP(r，r₁)	(x，r，y)→(x，r₁，y)
InverseOP(r，r₁)	(y，r，x)→(x，r₁，y)
SubOP(OPChain(r₁，r₂)，r)	(x₀，r₁，x₁)，(x₁，r₂，x₂)→(x₀，r，x₂)

下载: 导出CSV

表 2 对象属性表达公理向量空间中的表示及结论

对象属性表达公理	规则形式	线性映射	规则结论
ReflexiveOP(r)	(x，r，x)	V_xM_r=V_x	M_r=I
SymmetricOP(r)	(x，r，y)→(y，r，x)	V_xM_r=V_y，V_yM_r=V_x	M_rM_r=I
TransitiveOP(r)	(x，r，y)，(y，r，z)→(x，r，z)	V_xM_r=V_y，V_yM_r=V_z，V_xM_r=V_z	M_rM_r=M_r
EquivalentOP(r，r₁)	(x，r，y)→(x，r₁，y)	V_xM_r=V_y，V_xM_r₁=V_y	M_r=M_r₁
SubOP(r，r₁)	(x，r，y)→(x，r₁，y)	V_xM_r=V_y，V_xM_r₁=V_y	M_r=M_r₁
InverseOP(r，r₁)	(y，r，x)→(x，r₁，y)	V_yM_r=V_x，V_xM_r₁=V_y	M_rM_r₁=I
SubOP(OPChain(r₁，r₂)，r)	(x₀，r₁，x₁)，(x₁，r₂，x₂)→(x₀，r，x₂)	V_x₀M_r₁=V_x₁，V_x₁M_r₂=V_x₂，V_x₀M_r=V_x₂	M_r₁M_r₂=M_r

下载: 导出CSV

表 3 数据集统计信息

Dataset	WN18-sparse	WN18RR-sparse	FB15k-sparse	FB15k-237-sparse
#ent	40 943	40 943	14 951	14 541
#rel	18	11	1 345	237
#Train	141 442	86 835	483 142	272 115
#Valid	3 624	1 609	18 544	10 671
#Test	3 590	1 661	22 013	12 454

下载: 导出CSV

表 4 实验参数设置

实验参数	WN18-sparse	WN18RR-sparse	FB15k-sparse	FB15k-237-sparse
d	d=200	d=200	d=200	d=200
λ	λ=10^-5	λ=10^-4	λ=10^-5	λ=10^-4
θ	θ=0.9	θ=0.9	θ=0.9	θ=0.9
lr	lr=0.001	lr=0.001	lr=0.001	lr=0.001
max_epoch	max_epoch=100	max_epoch=150	max_epoch=100	max_epoch=150

下载: 导出CSV

表 5 WN18-sparse和FB15k-sparse上链接预测实验结果

模型	WN18-sparse					FB15k-sparse
	MRR		Hits@			MRR		Hits@
	Raw	Filter	1	3	10	Raw	Filter	1	3	10
TransE	33.5	41.8	10.2	71.1	84.7	25.5	39.8	25.8	48.6	64.5
DistMult	55.8	73.8	59.3	87.5	93.1	32.4	60.0	53.8	65.1	75.9
ComplEx	67.7	91.1	89.0	93.3	94.4	32.7	61.6	54.0	65.7	76.1
ANALOGY	67.5	91.3	89.0	93.4	94.4	33.1	62.0	54.3	66.1	76.3
IterE	78.9	91.3	89.1	93.5	94.8	38.8	62.8	55.1	67.3	77.1
I_IterE	80.0	92.5	91.1	95.0	96.7	40.1	63.8	56.5	68.8	79.1

下载: 导出CSV

表 6 WN18RR-sparse和FB15k-237-sparse上链接预测实验结果

模型	WN18RR-sparse					FB15k-237-sparse
	MRR		Hits@			MRR		Hits@
	Raw	Filter	1	3	10	Raw	Filter	1	3	10
TransE	12.4	14.6	3.4	24.7	28.8	15.6	23.8	16.4	26.1	38.5
DistMult	20.8	25.5	23.8	26.0	22.5	12.9	20.4	12.8	22.6	36.2
ComplEx	21.4	25.9	24.6	26.2	28.6	13.3	19.7	12.0	21.7	35.4
ANALOGY	13.3	19.8	24.6	27.5	28.7	13.9	19.8	12.3	21.4	34.9
IterE	25.7	27.4	25.4	28.1	31.4	18.6	24.7	17.9	26.2	39.2
I_IterE	27.0	28.9	27.1	30.5	34.5	20.0	26.6	20.1	28.6	42.8

下载: 导出CSV

表 7 规则评估实验结果

模型	WN18-sparse			WN18RR-sparse			FB15k-sparse			FB15k-237-sparse
模型	Time/s	HQr	比例/%	Time/s	HQr	比例/%	Time/s	HQr	比例/%	Time/s	HQr	比例/%
AMIE+	4.98	16	11.4	3.0	2	5.71	428	1 820	4.4	66.00	470	1.9
IterE	1.63	20	20.2	0.75	6	19.30	26.49	11 375	17.6	4.72	653	11.8
I_IterE	1.17	25	23.6	0.52	8	27.60	14.03	18 876	23.2	2.35	831	17.2

下载: 导出CSV

表 8 航空安全事件数据集下的实验结果

模型	MRR	Hits@1	Hits@2	Hits@3
IterE	44.0	37.8	48.5	53.8
I_IterE	50.2	45.7	54.7	57.0

下载: 导出CSV

表 9 可能的公理集及得分情况

可能的公理	公理得分
SymmetricOP(subclassof，part_of)	0.9
InverseOP(subclassof，haspart)	0.9
InverseOP(cause_of，result_of)	0.9
SubOP(OPChain(type_of，subclassof)，is_a)	0.9
SubOP(OPChain(is_a，haspart)，type_of)	0.7
…	…

下载: 导出CSV

表 10 高分公理推演的新三元组情况

高分公理	新三元组
0.9SymmetricOP(subclassof，part_of)	(沙赫乔斯特，part_of，事故地点)←(沙赫乔斯特，subclassof，事故地点)
0.9InverseOP(subclassof，haspart)	(航空器紧急事件，haspart，航空失事)←(航空失事，subclassof，航空器紧急事件)
0.9InverseOP(cause_of，result_of)	(山毛榉防空导弹击落，result_of，MH17)←(MH17，cause_of，山毛榉防空导弹击落)
0.9SymmetricOP(subclassof，part_of)	(航空受到非法干扰，part_of，航空器紧急事件)←(航空受到非法干扰，subclassof，航空器紧急事件)
0.9SymmetricOP(subclassof，part_of)	(航空器紧急事件，part_of，事故灾害类)←(航空器紧急事件，subclassof，事故灾害类)
0.9InverseOP(subclassof，haspart)	(事故灾害类，haspart，航空器紧急事件)←(航空器紧急事件，subclassof，事故灾害类)
0.9SubOP(OPChain(type_of，subclassof)，is_a)	(MH17，is_a，航空器紧急事件)←(MH17，type_of，航空器失事)，(航空器失事，subclassof，航空器紧急事件)
…	…

下载: 导出CSV

[1]	徐增林, 盛泳潘, 贺丽荣, 等.知识图谱技术综述[J].电子科技大学学报, 2016, 45(4): 589-606. doi: http://www.cnki.com.cn/Article/CJFDTotal-DKDX201604012.htm
[2]	王鑫, 邹磊, 王朝坤, 等.知识图谱数据管理研究综述[J].软件学报, 2019, 30(7): 2139-2174. doi: http://www.cnki.com.cn/Article/CJFDTotal-RJXB201907016.htm
[3]	FELLBAUM, C, MILLER, G. WordNet : an electronic lexical database[M]. WordNet: An Electronic Lexical Database. Cambridge: MIT Press, 1998.
[4]	BOLLACKER K, EVANS C, PARITOSH P, et al. Freebase: a Collaboratively Created Graph Database for Structuring Human Knowledge[C]//Proceedings of the 2008 ACM SIGMOD International Conference on Management of Data. Vancouver : ACM Press, 2008: 1247-1250.https://dl.acm.org/doi/10.1145/1376616.1376746
[5]	SUCHANEK F M, KASNECI G, WEIKUM G. Yago: a Core of Semantic Knowledge[C]//Proceedings of the 16th international conference on World Wide Web. Banff, Alberta: ACM Press, 2007: 697-706.https://dl.acm.org/doi/10.1145/1242572.1242667
[6]	饶子昀, 张毅, 刘俊涛, 等.应用知识图谱的推荐方法与系统[J/OL].自动化学报: 1-17[2020-09-28]. https://doi.org/10.16383/j.aas.c200128.
[7]	蔡泽胤.基于平移模型的知识图谱补全算法研究[D].武汉: 华中科技大学, 2019.
[8]	崔员宁, 李静, 沈力, 等. Duration-HyTE:基于持续时间建模的时间感知知识表示学习方法[J].计算机研究与发展, 2020, 57(6): 1239-1251.
[9]	BORDES A, USUNIER N, GARCIA-DURáN A, et al. Translating Embeddings for Modeling Multi-Relational Data[C]//NIPS'13: Proceedings of the 26th International Conference on Neural Information Processing Systems-Volume 2. Red Hook: Curran Associates Inc, 2013: 2787-2795.
[10]	WANG Z, ZHANG J W, FENG J L, et al. Knowledge Graph Embedding by Translating on Hyperplanes[C]//AAAI'14: Proceedings of the Twenty-Eighth AAAI Conference on Artificial Intelligence. Québec: AAAI Press, 2014: 1112-1119.
[11]	LIN Y, LIU Z, SUN M, et al. Learning Entity and Relation Embeddings for Knowledge Graph Completion[C]//AAAI'15: Proceedings of the Twenty-Ninth AAAI Conference on Artificial Intelligence. Austin, Texas: AAAI Press, 2015: 2181-2187.
[12]	JI G L, HE S Z, XU L H, et al. Knowledge Graph Embedding via Dynamic Mapping Matrix[C]//Proceedings of the 53rd Annual Meeting of the Association for Computational Linguistics and the 7th International Joint Conference on Natural Language Processing (Volume 1: Long Papers), Beijing : Association for Computational Linguistics, 2015: 687-696.
[13]	YANG B S, YIH W T, HE X D, et al. Embedding Entities and Relations for Learning and Inference in Knowledge Bases[EB/OL].[2014-10-27]. https://arxiv.org/abs/1412.6575v2.
[14]	TROUILLON T, WELBL J, RIEDEL S, et al. Complex Embeddings for Simple Link Prediction[C]//ICML'16: Proceedings of the 33rd International Conference on International Conference on Machine Learning-Volume 48. New York: JMLR org, 2016: 2071-2080.
[15]	LIU H X, WU Y X, YANY Y. Analogical Inference for Multi-Relational Embeddings[C]//ICML'17: Proceedings of the 34th International Conference on Machine Learning-Volume 70. Sydney: JMLR Org, 2017: 2168-2178.
[16]	胡卓.面向知识图谱的表示学习算法的研究与应用[D].成都: 电子科技大学, 2020.
[17]	doi: https://link.springer.com/content/pdf/10.1007%2Fs10994-010-5205-8.pdf LAO N, COHEN W W. Relational Retrieval Using a Combination of Path-Constrained Random Walks[J]. Machine Learning, 2010, 81(1): 53-67.
[18]	LAO N, MITCHELL T M, COHEN W W, et al. Random Walk Inference and Learning in A Large Scale Knowledge Base[C]//EMNLP'11: Proceedings of the Conference on Empirical Methods in Natural Language Processing. Edinburgh: Association for Computational Linguistics, 2011: 529-539.
[19]	GALARRAGA A L, TEFLIOUDI C, HOSE K, et al. AMIE: Association Rule Mining under Incomplete Evidence in Ontological Knowledge Bases[C]//WWW'13: Proceedings of the 22nd International Conference on World Wide Web. New York: Association for Computing Machinery, 2013: 413-422.
[20]	GALÁRRAGA L, TEFLIOUDI C, HOSE K, et al. Fast Rule Mining in Ontological Knowledge Bases with AMIE+[J]. The VLDB Journal, 2015, 24(6): 707-730. doi: 10.1007/s00778-015-0394-1
[21]	官赛萍, 靳小龙, 贾岩涛, 等.面向知识图谱的知识推理研究进展[J].软件学报, 2018, 29(10): 2966-2994. doi: http://www.cnki.com.cn/Article/CJFDTotal-RJXB201810006.htm
[22]	ZHANG W, PAUDEL B, WANG L, et al. Iteratively Learning Embeddings and Rules for Knowledge Graph Reasoning[C]//WWW'19: The World Wide Web Conference. New York: Association for Computing Machinery, 2019: 2366-2377.
[23]	王红, 李晗, 李浩飞.民航突发事件领域本体关系提取方法的研究[J].计算机科学与探索, 2020, 14(2): 285-293.
[24]	王红, 李浩飞, 邸帅.民航突发事件实体识别方法研究[J].计算机应用与软件, 2020, 37(3): 166-172.
[25]	XIE S, TU Z. Holistically-Nested Edge Detection[C]//2015 IEEE International Conference on Computer Vision(ICCV). Santiago: IEEE, 2015: 1395-1403.
[26]	HAJEK P. Towards Metamathematics of Weak Arithmetics over Fuzzy Logic[J]. Logic Journal of IGPL, 2011, 19(3): 467-475. doi: 10.1093/jigpal/jzp091
[27]	KINGMA D, BA J. Adam: A Method for Stochastic Optimization[EB/OL].[2014-10-24]. https://arxiv.org/abs/1412.6980v1.
[28]	冯兴杰, 曾云泽.基于评分矩阵与评论文本的深度推荐模型[J].计算机学报, 2020, 43(5): 884-900. doi: http://www.cnki.com.cn/Article/CJFDTotal-JSJX202005008.htm

图( 4) 表( 10)

计量

文章访问数: 5998
HTML全文浏览数: 5998
PDF下载数: 549
施引文献: 0

全文HTML

知识图谱(knowledge graph)是一种揭示实体之间关系的语义网络，可以对现实世界的事物及其相互关系进行形式化地描述^[1]，一般表示为三元组(头实体、关系、尾实体)的形式^[2].如WordNet^[3]，Freebase^[4]和YAGO^[5]等将知识图谱广泛应用于问答系统、智能搜索和个性推荐等领域，但是很多大型开放知识图谱都是由人工或半自动的方式构建的，这些图谱通常比较稀疏，大量实体之间隐含的关系未被充分挖掘出来^[6]，因此知识图谱的补全方法成为新的研究热点.

表示学习是实现知识图谱补全的有效方法，它将知识图谱的实体和关系映射到连续的向量空间，利用向量计算方式推出实体之间潜在的语义关系，使得计算复杂度降低^[7].表示学习中常用的两个模型是翻译模型和线性模型^[8]，其中翻译模型包括TransE模型^[9]和基于TransE的一系列改进模型，如TransH模型^[10]、TransR模型^[11]和TransD模型^[12]等.线性模型包括DistMult模型^[13]、ComplEx模型^[14]和ANALOGY模型^[15]等，线性模型还具有良好的规则学习属性.但这两种模型对具有较少关系的实体(稀疏实体)表示效果较差^[16]，因为好的表示依赖于丰富的知识.规则学习也是知识图谱补全的重要手段，主要利用规则的演绎能力进行关系推演，可以保证结果的可靠性和可解释性.规则学习包括基于随机行走的规则挖掘^[17-18]、知识图谱关联规则挖掘算法AMIE^[19]及改进的AMIE+^[20]等基于图结构的规则学习方法.这些方法虽然在结构上加快了推理速度^[21]，一定程度上缓解了规则学习的高复杂问题，但是仍存在规则搜索空间大、无法较好评估规则和仅考虑知识图谱结构等问题.

2019年，Zhang等人^[22]提出了IterE模型，首次利用具有丰富语义OWL2中的对象属性表达公理进行演绎推理，有效提升了稀疏实体的表示效果和规则学习的效率.但该模型仅包含表示学习层和规则学习层，其泛化能力较弱，且模型中所采用的Frobenius范数计算方式复杂、无法显著区分高分公理.在航空安全事件知识图谱的研究方面，王红等人^[23-24]研究了民航突发事件实体与关系的自动抽取方法，初步解决了航空安全事件知识图谱的构建问题，但未充分考虑实例层和概念层(本体)内稀疏实体之间隐含的语义关系.

为此，本研究提出一种改进的知识图谱补全方法(I_IterE)，通过增加特征层和改进的评分机制获得高分公理进行演绎推理，旨在更好地利用高分公理进行演绎推理和链接预测，实现航空安全事件知识图谱的进一步补全，为基于知识图谱的航空安全事件语义分析提供更好的数据支持.

3. 结束语

本研究提出了一种改进的知识图谱补全方法(I_IterE)，通过增加模型深度且改进评分机制，有效提升了链接预测的准确率和规则学习的效率，在获得较多高质量规则实现推理的同时，进一步提高了模型的泛化能力.将该方法应用于航空安全事件数据集，较好地解决了航空安全事件知识图谱的补全问题.未来围绕OWL2的数据属性表达公理和类属性表达公理，可以进一步研究知识图谱补全的优化方法.

参考文献 (28)

姓名
	姓名不能为空！
邮箱
	邮箱不能为空！非法的邮箱地址。
手机号码
	电话不能为空！请输入有效手机号!
标题
	标题不能为空！
留言内容
	内容不能为空！
验证码
	验证码不能为空！验证码错误！

留言板

航空安全事件知识图谱补全方法

中国民航大学计算机科学与技术学院，天津 300300

作者简介:
王红(1963-)，女，教授，主要从事研究语义数据挖掘与知识图谱研究 .

The Method of Completing the Knowledge Graph of Aviation Safety Incidents

School of Computer Science and Technology, Civil Aviation University of China, Tianjin 300300, China

计量

航空安全事件知识图谱补全方法

作者简介: 王红(1963-)，女，教授，主要从事研究语义数据挖掘与知识图谱研究
中国民航大学计算机科学与技术学院，天津 300300

English Abstract

The Method of Completing the Knowledge Graph of Aviation Safety Incidents

全文HTML

1.1. 表示学习层

1.2. 特征增强层

1.3. 规则学习层

1.3.1. 公理集生成

1.3.2. 改进的评分机制

1.3.3. 公理演绎

1.4. 实验效果分析

1.4.1. 实验数据与参数设置

1.4.2. 链接预测

1.4.3. 规则评估

2.1. 实验过程

2.2. 效果分析

目录

留言板

航空安全事件知识图谱补全方法

中国民航大学 计算机科学与技术学院，天津 300300

作者简介: 王红(1963-)，女，教授，主要从事研究语义数据挖掘与知识图谱研究 .

The Method of Completing the Knowledge Graph of Aviation Safety Incidents

School of Computer Science and Technology, Civil Aviation University of China, Tianjin 300300, China

计量

出版历程

航空安全事件知识图谱补全方法

作者简介: 王红(1963-)，女，教授，主要从事研究语义数据挖掘与知识图谱研究 中国民航大学 计算机科学与技术学院，天津 300300

English Abstract

The Method of Completing the Knowledge Graph of Aviation Safety Incidents

全文HTML

1.1. 表示学习层

1.2. 特征增强层

1.3. 规则学习层

1.3.1. 公理集生成

1.3.2. 改进的评分机制

1.3.3. 公理演绎

1.4. 实验效果分析

1.4.1. 实验数据与参数设置

1.4.2. 链接预测

1.4.3. 规则评估

2.1. 实验过程

2.2. 效果分析

目录

中国民航大学计算机科学与技术学院，天津 300300

作者简介:
王红(1963-)，女，教授，主要从事研究语义数据挖掘与知识图谱研究 .

作者简介: 王红(1963-)，女，教授，主要从事研究语义数据挖掘与知识图谱研究
中国民航大学计算机科学与技术学院，天津 300300