留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

基于特征增强的多方位农业问句语义匹配

上一篇

下一篇

王奥, 吴华瑞, 朱华吉. 基于特征增强的多方位农业问句语义匹配[J]. 西南大学学报(自然科学版), 2023, 45(6): 201-210. doi: 10.13718/j.cnki.xdzk.2023.06.020
引用本文: 王奥, 吴华瑞, 朱华吉. 基于特征增强的多方位农业问句语义匹配[J]. 西南大学学报(自然科学版), 2023, 45(6): 201-210. doi: 10.13718/j.cnki.xdzk.2023.06.020
WANG Ao, WU Huarui, ZHU Huaji. Multi-Level Semantic Matching of Agricultural Questions Based on Feature Enhancement[J]. Journal of Southwest University Natural Science Edition, 2023, 45(6): 201-210. doi: 10.13718/j.cnki.xdzk.2023.06.020
Citation: WANG Ao, WU Huarui, ZHU Huaji. Multi-Level Semantic Matching of Agricultural Questions Based on Feature Enhancement[J]. Journal of Southwest University Natural Science Edition, 2023, 45(6): 201-210. doi: 10.13718/j.cnki.xdzk.2023.06.020

基于特征增强的多方位农业问句语义匹配

  • 基金项目: 科技创新2030——“新一代人工智能”重大项目(2021ZD0113605);国家重点研发计划项目(2019YFD1101105,2020YFD1100602)
详细信息
    作者简介:

    王奥,硕士研究生,主要从事农业智能问答研究 .

    通信作者: 朱华吉,博士,研究员
  • 中图分类号: TP391.1

Multi-Level Semantic Matching of Agricultural Questions Based on Feature Enhancement

  • 摘要: 农业问句文本数据具有专业名词多、特征稀疏、语句规范性差等特征,难以深入挖掘句间交互关系. 为改善农业相似问句的匹配性能,提出一种基于特征增强的多方位农业问句语义匹配模型. 模型通过共享参数的双向长短期记忆网络提取上下文向量,分别引入自注意力机制、多维注意力机制增强农业问句文本语义推断特征和文本距离特征,通过多特征增强聚焦语义特征信息,将增强特征嵌入到多方位匹配函数中,从向量值、方向和元素等角度进行句间相似度对比,以捕获句子多样性特征. 从农业问答社区导出农业问答文本数据,人工标注相似问句构建试验数据集. 试验结果表明:基于特征增强的多方位农业问句语义匹配模型可以增强文本特征之间的交互,获取更多的关系特征信息,在构建的农业问句数据集上正确率及F1值达95.3%和97.3%,与其他5种问句语义匹配模型相比,效果提升明显.
  • 加载中
  • 图 1  特征增强语义匹配模型架构图

    图 2  文本距离特征增强

    图 3  注意权重可视化图

    图 4  不同模型在农业问句数据集不同类别的准确率

    表 1  训练集样本示例

    问句1 问句2 标签 类别
    小青菜霜霉病病菌产生卵孢子的适宜温湿度是多少? 小青菜霜霉病病菌什么时候产生卵孢子? 0 病虫草害
    大豆高产栽培技术是什么? 请问咋进行大豆高产栽培? 1 栽培管理
    如何防治豆角炭疽病? 豆角炭疽病的发病条件是? 0 病虫草害
    如何搞好莴笋病虫害防治? 怎么才能种植好莴笋? 0 栽培管理
    玉米生长期需要施什么肥? 玉米生长期什么样的肥料好 1 土壤肥料
    羊低镁血病的症状是什么? 羊低镁血病预防措施是什么? 0 动物疫病
    水稻的田间管理技术要点有哪些? 如何进行水稻的田间管理? 1 栽培管理
    肉牛养殖管理要点是啥? 肉牛夏季养殖如何防暑 0 养殖管理
    下载: 导出CSV

    表 2  K值对模型性能的影响 %

    k 0 1 2 3 4 5 6
    农业文本 94.1 94.3 94.5 95.3 94.3 94.0 93.8
    lcqmc 91.1 91.4 91.6 91.9 91.7 91.5 90.7
    下载: 导出CSV

    表 3  消融试验 %

    序号 模型 正确率 精确率 召回率 F1值
    1 本文模型 95.3 97.1 97.5 97.3
    2 删除距离增强 93.8 95.7 97.1 96.4
    3 删除推断增强 93.6 96.9 95.1 96.2
    4 删除多方位匹配 94.6 97.0 96.7 96.8
    5 删除距离增强和推断增强 90.1 89.6 89.1 89.3
    6 Siamese-BILSTM 88.1 87.3 88.2 87.7
    下载: 导出CSV

    表 4  部分预测结果

    问句1 问句2 标签 预测
    大棚茄子6月管理技术要点有哪些? 6月份温室茄子的管理要点是什么? 1 1
    大豆带状种植要点? 大豆高产栽培要点? 0 0
    番茄晚疫病有什么症状? 如何防治番茄晚疫病? 0 0
    肉牛养殖管理要点是啥? 肉牛夏季养殖如何防暑 1 1
    下载: 导出CSV

    表 5  不同模型对比结果 %

    试验模型 正确率 精确率 召回率 F1值
    ESIM 91.7 91.1 93.8 92.5
    DIIN 89.3 88.7 89.4 89.1
    TextCNN 82.2 76.1 88.6 81.9
    BIMPM 88.7 89.1 88.6 88.8
    ABCNN 87.1 87.4 86.7 87.0
    本文模型 95.3 97.1 97.4 97.3
    下载: 导出CSV
  • [1] FENGSHI, JING. Knowledge-Enhanced Attentive Learning for Answer Selection in Community Question Answering Systems [J]. Knowledge-Based Systems, 2022, 250: 109117. doi: 10.1016/j.knosys.2022.109117
    [2] 马满福, 刘元喆, 李勇, 等. 基于LCN的医疗知识问答模型[J]. 西南大学学报(自然科学版), 2020, 42(10): 25-36. doi: http://xbgjxt.swu.edu.cn/article/doi/10.13718/j.cnki.xdzk.2020.10.004
    [3] 施志刚. 基于改进协同表示的二级分类人脸识别方法[J]. 西南大学学报(自然科学版), 2017, 39(1): 172-178. doi: http://xbgjxt.swu.edu.cn/article/doi/10.13718/j.cnki.xdzk.2017.01.026
    [4] LIU Y, TANG A H, SUN Z B, et al. An Integrated Retrieval Framework for Similar Questions: Word-Semantic Embedded Label Clustering-LDA with Question Life Cycle [J]. Information Sciences, 2020, 537: 227-245. doi: 10.1016/j.ins.2020.05.014
    [5] 王寒茹, 张仰森. 文本相似度计算研究进展综述[J]. 北京信息科技大学学报(自然科学版), 2019, 34(1): 68-74. doi: 10.16508/j.cnki.11-5866/n.2019.01.013
    [6] WANG M, SMITH N A, TERUKO M. What is the Jeopardy Model? A Quasi-Synchronous Grammar for QA [C] //Proceedings of the 2007 Joint Conference on Empirical Methods in Natural Language Processing and Computational Natural Language Learning. Prague, Czech Republic: Association for Computational Linguistics Press, 2007: 22-32.
    [7] KALCHBRENNER N, GREFENSTETTE E, BLUNSOM P. A Convolutional Neural Network for Modelling Sentences [EB/OL]. 2014: arXiv: 1404. 2188. https://arxiv.org/abs/1404.2188.
    [8] GREFF K, SRIVASTAVA R K, KOUTNIK J, et al. LSTM: a Search Space Odyssey [J]. IEEE Transactions on Neural Networks and Learning Systems, 2017, 28(10): 2222-2232. doi: 10.1109/TNNLS.2016.2582924
    [9] 卜伟琼, 方逵, 陈益能. 农业知识问答系统句子相似度算法研究[J]. 农业网络信息, 2012(10): 17-20. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-JSJN201210006.htm
    [10] MUELLER J, THYAGARAJAN A, Siamese Recurrent Architecture for Learning Sentence Similarity [C] //Proceedings of the Thirtieth AAAI Conference on Artificial Intelligence. Phoenix Arizona, USA: AAAI Press, 2016: 2786-2792.
    [11] 刘志超, 王晓敏, 吴华瑞, 等. 基于BiLSTM-CNN的水稻问句相似度匹配方法研究[J]. 中国农机化学报, 2022, 43(12): 125-132. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-GLJH202212019.htm
    [12] 金宁, 赵春江, 吴华瑞, 等. 基于多语义特征的农业短文本匹配技术[J]. 农业机械学报, 2022, 53(5): 325-331. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-NYJX202205034.htm
    [13] VASWANI A, SHAZZER N, PARMAR N, et al. Attention is All You Need [C] //Proceedings of the 31st International Conference on Neural Information Processing Systems. New York, USA: Curran Associates Inc Press, 2017: 6000-6010.
    [14] TAN C Q, WEI F R, WANG W H, et al. Multiway Attention Networks for Modelling Sentence Paris [C] //Proceedings of the 27th International Joint Conference on Artificial Intelligence. Stockholm Sweden: AAAI Press, 2018: 4411-4417.
    [15] KIM S, KANG I, KWAK N. Semantic Sentence Matching with Densely-Connected Recurrent and Co-Attentive Information [J]. Proceedings of the AAAI Conference on Artificial Intelligence, 2019, 33(1): 6586-6593.
    [16] LU W P, ZHANG X, LU H M, et al. Deep Hierarchical Encoding Model for Sentence Semantic Matching [J]. Journal of Visual Communication and Image Representation, 2020, 71: 102794.
    [17] 王郝日钦, 王晓敏, 缪祎晟, 等. 基于BERT-Attention-DenseBiGRU的农业问答社区问句相似度匹配[J]. 农业机械学报, 2022, 53(1): 244-252. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-NYJX202201027.htm
    [18] 于碧辉, 王加存. 孪生网络中文语义匹配方法的研究[J]. 小型微型计算机系统, 2021, 42(2): 231-234. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-XXWX202102002.htm
    [19] 冯月春, 陈惠娟. 改进Bi-LSTM的文本相似度计算方法[J]. 计算机工程与设计, 2022, 43(5): 1397-1403. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-SJSJ202205026.htm
    [20] 石彩霞, 李书琴, 刘斌. 多重检验加权融合的短文本相似度计算方法[J]. 计算机工程, 2021, 47(2): 95-102. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-JSJC202102014.htm
    [21] 刘继明, 于敏敏, 袁野. 基于句向量的文本相似度计算方法[J]. 科学技术与工程, 2020, 20(17): 6950-6955. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-KXJS202017036.htm
    [22] CHEN Q, ZHU X, LING Z, et al. Enhanced LSTM for Natural Language Inference [EB/OL]. (2017-04-26) [2023-02-27]. 2016: arXiv: 1609. 06038. https://arxiv.org/abs/1609.06038.
    [23] GONG Y, LUO H, ZHANG J. Natural Language Inference over Interaction Space [EB/OL]. (2017-09-13) [2023-02-07]. 2017: arXiv: 1709. 04348. https://arxiv.org/abs/1709.04348.
    [24] YIN W P, SCHVTZE H, XIANG B, et al. ABCNN: Attention-Based Convolutional Neural Network for Modeling Sentence Pairs [J]. Transactions of the Association for Computational Linguistics, 2016, 4: 259-272.
    [25] WANG Z G, HAMZA W, FLORIAN R. Bilateral Multi-Perspective Matching for Natural Language Sentences [C] //Proceedings of the Twenty-Sixth International Joint Conference on Artificial Intelligence. August 19-26, 2017. Melbourne, Australia. California: International Joint Conferences on Artificial Intelligence Organization, 2017: 4144-4150.
    [26] ZHANG Y, WALLACE B. A Sensitivity Analysis of (and Practitioners' Guide to) Convolutional Neural Networks for Sentence Classification [C] //Proceedings of the Eighth International Joint Conference on Natural Language Processing. Taiwan, China: Asian Federation of Natural Language Processing, 2016: 253-263.
  • 加载中
图( 4) 表( 5)
计量
  • 文章访问数:  5301
  • HTML全文浏览数:  5301
  • PDF下载数:  224
  • 施引文献:  0
出版历程
  • 收稿日期:  2023-02-07
  • 刊出日期:  2023-06-20

基于特征增强的多方位农业问句语义匹配

    通信作者: 朱华吉,博士,研究员
    作者简介: 王奥,硕士研究生,主要从事农业智能问答研究
  • 1. 广西大学 计算机与电子信息学院,南宁 530004
  • 2. 北京市农林科学院 信息技术研究中心,北京 100097
  • 3. 国家农业信息化工程技术研究中心,北京 100097
  • 4. 农业农村部 数字乡村技术重点实验室,北京 100097
基金项目:  科技创新2030——“新一代人工智能”重大项目(2021ZD0113605);国家重点研发计划项目(2019YFD1101105,2020YFD1100602)

摘要: 农业问句文本数据具有专业名词多、特征稀疏、语句规范性差等特征,难以深入挖掘句间交互关系. 为改善农业相似问句的匹配性能,提出一种基于特征增强的多方位农业问句语义匹配模型. 模型通过共享参数的双向长短期记忆网络提取上下文向量,分别引入自注意力机制、多维注意力机制增强农业问句文本语义推断特征和文本距离特征,通过多特征增强聚焦语义特征信息,将增强特征嵌入到多方位匹配函数中,从向量值、方向和元素等角度进行句间相似度对比,以捕获句子多样性特征. 从农业问答社区导出农业问答文本数据,人工标注相似问句构建试验数据集. 试验结果表明:基于特征增强的多方位农业问句语义匹配模型可以增强文本特征之间的交互,获取更多的关系特征信息,在构建的农业问句数据集上正确率及F1值达95.3%和97.3%,与其他5种问句语义匹配模型相比,效果提升明显.

English Abstract

  • 开放科学(资源服务)标志码(OSID):

  • 农业复杂交互式问答平台为农户提供专家在线指导、在线学习、农业技术交流多种功能[1-2],在协助用户解决农业生产生活和日常信息需求中发挥着重要作用. 平台农户和专家实时在线互动,问答文本海量增长,但经常出现不同表达方式表达相同语义的情况,相似问题解答消耗大量人力、物力,因此构建能够快速准确给出答案的问答系统就显得十分必要. 相似度匹配是语音、人脸识别[3]、问答等系统的基础任务,其相似度计算的精度直接影响问答系统回复的准确率,利用问句相似度匹配[4]开展高精度的农业智能问答模型研究,是农业智能化的重要发展方向.

    以往的语义匹配研究集中在短语、语法和词汇匹配,如文献[5]提出一种语法驱动的文本匹配方法,通过融合具有鲁棒性的非词汇语法和由对数驱动的词汇语法的线性模型进行文本匹配. 随着深度学习的蓬勃发展[6-8],语义匹配从基础的文本嵌入到相似度计算,再到复杂的神经网络,有效解决了人工设计特征提取量少、泛化性差的问题. 卜维琼等[9]针对农业领域特征,提出一种多重信息融合的相似度算法,首次将深度学习与农业问句匹配结合. 孪生神经网络在文本匹配领域表现出良好的性能[10]. 刘志超等[11]采用孪生神经网络架构,结合双向长短期神经网络和卷积神经网络进行水稻问句语义匹配. 这种网络结构减少训练模型参数,提高了训练效率. 金宁等[12]采用孪生神经网络结构,运用双向长短期记忆网络、卷积神经网络和密集连接网络从深度语义、词语共现、最大匹配度3个层面实现农业短文本匹配,但是直接进行句子表示的相似度匹配,忽略了句间交互,导致交互特征信息的损失,无法有效学习句子关系特征.

    注意力机制[13]可有效解决上述问题,利用注意力机制对特征信息进行聚合或增强匹配信息,挖掘丰富的句子关联信息[14-16]. 融入注意力机制的交互模型通过赋予词不同的权重,能快速获得有效信息,有效提升文本匹配模型性能,文献[17]针对农业文本特征,利用基于协同注意力机制的紧密连接BiGRU(双向门控循环单元)实现农业问句相似度匹配. 在注意力机制基础上从字、词、句的角度研究文本相似度计算[18-21],细粒度对比句子差异能够提高相似度计算的效率和准确率. 但农业文本数据存在词汇总量较少、专有名词多,具有冗余性、稀疏性、规范性差等特点,导致传统语义匹配方法提取句子间关联特征信息不够充分,忽略了句间推理关系. 如何实现农业相似问句语义智能检索仍是农业问答需要解决的一个重要问题.

    针对农业文本句子关联特征信息难以深入挖掘,句子多样性捕获不足等问题,构建双向长短期循环神经网络提取特征,融合自注意力机制、多维注意力机制增强的文本语义推断特征和距离特征,通过多特征增强聚焦语义特征,将增强特征嵌入多方位匹配层,多角度对比句子特征信息,捕获句子的多样性,以期实现农业问句精准、自动的语义匹配.

  • 图 1所示,农业文本专业名词多、规范性差和高度依赖上下文等特点导致句子交互信息提取不足,句间关系推理不够深入;本文构建适用于农业问句文本的特征增强文本匹配模型,由特征提取层、特征增强层、多方位匹配层构成. 特征增强层利用自注意力机制和多维注意力机制提取不同粒度的局部特征,获取具有丰富语义的交互向量特征. 将两种增强特征信息嵌入多方位匹配函数中,由3种匹配函数实现文本特征的多角度对比. 作为问答的基础任务,相似度匹配精度的提升能有效提高问答系统的答案返回效率和准确率. 利用BILSTM(双向长短期记忆网络)提取农业文本输入上下文向量,获得农业问句文本前后关联语义,设置2层BILSTM网络,每层LSTM的隐藏神经单元为128个.

  • 传统文本匹配模型获取文本特征后直接进行相似度对比,缺少关联特征信息或挖掘不够深入. 农户提问问句存在文本数据专业名词多、规范性差等特点,文本关系特征信息难以挖掘. 利用自注意力机制、多维注意力机制分别增强语义推理特征和文本距离特征,准确聚焦语义特征,合理建模上下文信息,提高问答匹配精度.

  • 通过自注意力机制计算注意力权重,获得文本向量间的对齐关系. 公式(1)为权重计算公式,作为隐藏状态的相似性矩阵.

    式中pi表示句子p的第i个时间步的隐藏状态,qj同理;dH为缩放因子.

    通过上式的注意权重获取向量间的局部相关性,隐藏状态piqj中的相关语义在kij中表示. 两个句子之间的相互关联和组合表达由下式得到:

    式中,$\widetilde{q_i} $pj的权重和,即qj中与pi相关的内容被抽出,用$\widetilde{p_i} $表示,$\widetilde{q_j}$同理.

    农业问句文本中存在“蕴含”“矛盾”“中性”等多种关系,“蕴含”指句子p能推断出句子q,例如“玉米栽培技术要点是什么”推断出“我想学习玉米栽培技术”. “矛盾”指句子p能推断出句子q的否定,例如“红薯的主要病害有哪些”与“红薯的形态特征是什么”互为否定. “中性”为其他所有情况. 对于农业文本数据的稀疏性,传统自然语言匹配方法很难推理得到文本的多种关系和相关语义. 通过pi$\widetilde{q_i} $pj$\widetilde{q_j} $之间的向量运算来锐化局部推理特征信息,捕获局部推理过程中比较明显或突出的特征信息,或者获取矛盾关系的推理信息. 最后将差值向量、原始隐藏状态向量和句子间的关联表示拼接起来,得到增强语义推断特征.

  • 农业特定领域中,农业专业术语比常用词承载了更多信息,可作为问句中关键词. 循环神经网络提取特征时,直接提取句子的每个词向量,忽略了关键词在句子语义表示中的重要作用. 引入多维自注意力机制捕获每个词的上下文表示,强调关键词的重要性,增强句子中原始语义特征的提取. 多维自注意力将传统自注意力中的权重向量替换为权重矩阵,使向量特征获得独自的权重. 注意力权重公式如下:

    式中,gigj为句中的隐藏状态,W1W2为可学习的权重矩阵,b是大小为隐藏节点个数的偏置.

    农业问句文本中词间的距离能代表其相关性,引入距离感知掩码使相近词获得更多关注,距离更远的词关注更少. 计算相似度时词间距离越远所加负数越小,经过softmax函数后,距离越远的词权重越小,词间的依赖也随之削弱. 在公式(6)中加上掩码MM维度为1×1,矩阵中的值在{0,-∞}之间,由此构建适用农业问句文本函数(7):

    忽略Mij为负无穷的情况,i=j时,Mij为负无穷,即词向量与自身相比. 其余情况取决ij的关系,公式(8)为掩码矩阵的取值范围. f(ij)为ij的距离函数,k是超参数,为正标量. |i-j|<k时,Mij为0,表示当词间距离小于k时,s(gigj)为原始相似度;当|i-j|≥kij时,Mij为距离函数f(ij),词间距离呈负相关. 通过文本距离特征增强获得句子表示p′和q′. 文本距离增强如图 2所示. 为防止问句过长导致过分削弱词之间的注意分数,当句子长度小于t时距离函数采用线性函数,如式(9). 句子长度大于t时,采用对数函数,如式(10). t为正标量的超参数.

    将上述增强特征信息输入特征融合层,融合增强局部推理特征表示和增强距离感知特征表示,不仅增强语义特征,而且保留了句子间的交互特征,获得具有丰富语义特征信息的对齐特征向量.

  • 为了解决农业文本数据的稀疏性和文本词汇总量少导致的句子间关系信息获取不充分的问题,使用3种匹配函数从不同角度获取更丰富的聚合信息和更准确的句子关系. 余弦相似匹配根据词频对比匹配相似程度,对单字分组匹配时准确率高.

    式中,特征在所有维度上均减去均值R,减少余弦匹配因仅进行向量对比的影响.

    余弦相似度是对向量空间的度量,忽略了排序和重叠词影响. 利用投影点积相似度匹配将向量进行投影,通过点积乘法,同时进行大小和角度的对比,考虑整个句子值对相似度的影响. 其中WpWq为可学习参数,σ为sigmoid函数.

    元素匹配则从元素角度比较向量异同. 词在句子中的重要程度不同,其向量值也不同. 计算向量差异和能更好地学习句间关系. 同时使用3种匹配函数,从不同角度捕捉句子间的特征关联得到最终的匹配向量.

    3种输出向量通过平均池化和最大池化聚合全局语义,导入语义特征,对最终匹配向量进行聚合. 输入到多层感知机(MLP)分类器,使用tanh激活函数和softmax函数输出,模型采用端对端的训练方式,损失函数为交叉熵损失函数.

  • 通过农业领域最大的知识问答社区“中国农技推广信息平台”后台导出涉及5个种类的20 000个问答对来构建农业问句匹配数据集. 采用jieba分词工具加载停用词表,剔除文本中的停用词、特殊符号等冗余信息. 人工筛选出信息不完整和无效问答的问句,标注相似问句,相同语义的问句占比为54%,不同语义的问句标注占比为46%,问答对包含病虫草害、土壤肥料、栽培管理、动物疫病、养殖管理等5类. 训练集和测试集比例为8∶2,利用Adam优化器迭代更新神经网络权重,采用准确率、精确率、召回率和F1值作为评价指标. 表 1为训练集样本示例.

    模型训练迭代次数设置为70,batchsize为110,BiLSTM模型输出特征维度为128维,全连接层隐藏单元设置为128,学习率设置为0.001,问句中有效词语使用300维的词向量表示,句子最大长度为20,孪生网络共享参数. 为防止过拟合,模型使用dropout函数,随机使神经元失活,dropout设置为0.2.

  • 掩码矩阵由超参数k来决定距离函数的取值,词距离大于等于k时使用距离掩码限制注意力权重,如表 2所示,为验证k值对模型性能的影响,将k值分别设置为0,1,2,3,4,5,6. 分别在农业文本数据和lcqmc数据集上进行试验对比,k为0时,使用掩码矩阵限制注意力权重,此时距离当前词较远的词注意力权重较低,k为1时相邻词会得到更多的注意力权重. 试验表明,k为3时性能较好,k继续增大,对模型性能影响变差,因此关注距离当前词2或3个词时获取信息更多. 在lacqmc数据集上准确率均在90%以上,仍不及在农业数据上的表现,说明模型具有一定的泛用性,但更适合处理农业文本.

    通过一组试验验证本文模型各个模块的有效性,删除语义推断增强和文本距离增强得到模型2和模型3. 由表 3可知,正确率和F1值下降了1.7,1.1个百分点和1.5,0.9个百分点,表明单独的特征增强无法充分挖掘农业问句文本的交互信息. 同时删除两种特征增强策略得到模型5,可以看出两种策略融合更能提高模型的效果. 模型6为共享参数的BILSTM模型,删除多角度匹配后正确度和F1值下降了0.6,0.5个百分点,因为单一角度的匹配无法获取足够的句子多样性. 表 4为试验部分预测结果展示,语义相同的问句标签记为1,反之标签记为0,预测与标签值相同时则为预测成功.

    图 3为来自农业文本数据集的一个实例的注意力权重热力图,问句1为“土豆早疫病有哪些症状表现?”,问句2为“土豆早疫病发病原因是什么?”. 图 3a是两个句子自注意力的对齐情况,其中“土豆-土豆”,“早疫病-早疫病”,“症状-发病”有很强的对齐关系,这些为句子关键词,可明确表示句子语义,通过捕捉两句话对齐关系可一定程度上判断词间关系. 图 3b是同一问句注意力权重的可视化结果,可以看出距离更近的词间注意力权重更大,融合语义推断特征和文本距离特征进一步捕获句子的语义对齐信息,获取丰富的交互信息,提升语义匹配任务的性能.

    本文与相似度匹配常用5个深度学习模型进行对比,ESIM[22]使用BILSTM提取文本特征,计算两个句子向量特征的相似度矩阵,对向量特征加权,再由一层BILSTM整合向量特征,获得新的文本向量表示进行相似度匹配;DIIN[23]是一种交互推理网络,使用密集连接的卷积神经网络在交互空间中分层提取语义特征实现句子对的理解;ABCNN[24]在CNN的基础上引入注意力机制,在卷积计算和池化计算之前进行注意力权重计算,判断文本相似情况;BIMPM[25]在BILSTM提取文本特征后,根据两句话不同的时间进行多角度对比;TextCNN[26]通过不同大小的内核获取句子信息,使用CNN完成句子的匹配和分类.

    表 5展示了6种模型针对农业问句数据集的试验结果,本文模型在正确率、精确率、召回率、F1值均超过了95%,较对比模型均有明显提升,对比模型中,ESIM模型4项指标均超过91%. 本文模型F1值较其他模型提高接近5个百分点. 说明该模型能较为全面地捕捉文本间的交互信息,相似度计算总体性能较好. 以卷积神经网络框架为基础的模型评价指标均低于以循环神经网络框架为基础的模型,这是由网络结构所决定的,卷积神经网络结构更擅长局部特征信息的提取,并非文本序列化方向的特征提取,且会丢失一些距离较远的文本特征向量. 5种对比模型中ESIM模型召回率为93.8%,但仍与本文模型有些差距.

    图 4,与ESIM,DIIN,ABCNN,BIMPM,TextCNN 5种文本匹配模型相比,本文模型在病虫草害、家畜疫病、栽培管理、养殖管理、土壤肥料5个类别的问句数据集上均有最高的匹配准确率,整体匹配效果优于对比匹配模型. 在病虫草害和栽培管理两个试验数据量充足的类别上准确率率为95.0%和94.7%,因为数据集越充分,对深度学习模型迭代训练的效果提升越高. 在养殖管理和土壤肥料两个数据量较少的类别中也高于其他模型的精确率,说明本文模型鲁棒性较强,在数据量不充足时也能有效提取文本特征进行相似度匹配.

  • 为提高农户和农技工作者对农业问题检索的效率,减轻农业专家回复相似问题的压力及人工回复的延时性,构建了包含5个类别的农业问句语料库,提出一种基于多特征增强的农业问句语义匹配模型,在特征增强层增强语义推断特征和文本距离特征,深层次挖掘出农业文本交互特征信息,进一步获取丰富的文本间关联特征信息,由多方位匹配获取更丰富的聚合信息和句子关系. 试验证明,在构建的农业问句数据集上较其他模型对语义匹配的计算性能有进一步提升,实现农业问句快速自动检测,有效提高农业智能问答中海量问句匹配效率和问答结果的准确率,进一步发挥智能问答在农技推广领域中的作用. 由于农业具有地域性,在未来的工作中可考虑开展对方言问句和非规范的口语化问句语义匹配的相关研究.

参考文献 (26)

目录

/

返回文章
返回