留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

文本分类中的主动多域学习

上一篇

下一篇

赖娟;金澎;洪艳伟. 文本分类中的主动多域学习[J]. 西南师范大学学报(自然科学版), 2014, 39(7). doi: 10.13718/j.cnki.xsxb.2014.07.021
引用本文: 赖娟;金澎;洪艳伟. 文本分类中的主动多域学习[J]. 西南师范大学学报(自然科学版), 2014, 39(7). doi: 10.13718/j.cnki.xsxb.2014.07.021
LAI Juan , JIN Peng , HONG Yan-wei. Multi-Domain Active Learning in Text Classification[J]. Journal of Southwest China Normal University(Natural Science Edition), 2014, 39(7). doi: 10.13718/j.cnki.xsxb.2014.07.021
Citation: LAI Juan , JIN Peng , HONG Yan-wei. Multi-Domain Active Learning in Text Classification[J]. Journal of Southwest China Normal University(Natural Science Edition), 2014, 39(7). doi: 10.13718/j.cnki.xsxb.2014.07.021

文本分类中的主动多域学习

Multi-Domain Active Learning in Text Classification

  • 摘要: 现有主动学习主要着眼于对单个域训练方法的研究,不同域有不同的特征,同时也存在一些隐含的共性。如何从多个域中选择合适数据样本成为多域学习中减少人工标注工作量的关键。本文提出了一个新颖的主动多域学习框架,该框架充分考虑了重复信息,并可从多个域中选择合适的数据样本。该框架首先找到一个包含不同域间隐含共性的共享子空间,然后将所有数据样本分解为公共域部分和个性域部分,其中公共域部分可视为域间的重复信息,该部分在查询时需要被考虑到。最后,将主动多域学习方法与最新的主动学习方法的性能进行了比对,实验结果表明,本文提出的主动多域学习方法在减少人工标注工作量方面有显著作用。
  • 加载中
  • 加载中
计量
  • 文章访问数:  1129
  • HTML全文浏览数:  336
  • PDF下载数:  0
  • 施引文献:  0
出版历程

文本分类中的主动多域学习

  • 乐山师范学院智能信息处理及应用实验室,四川乐山614000; 乐山师范学院计算机科学学院,四川乐山614000

摘要: 现有主动学习主要着眼于对单个域训练方法的研究,不同域有不同的特征,同时也存在一些隐含的共性。如何从多个域中选择合适数据样本成为多域学习中减少人工标注工作量的关键。本文提出了一个新颖的主动多域学习框架,该框架充分考虑了重复信息,并可从多个域中选择合适的数据样本。该框架首先找到一个包含不同域间隐含共性的共享子空间,然后将所有数据样本分解为公共域部分和个性域部分,其中公共域部分可视为域间的重复信息,该部分在查询时需要被考虑到。最后,将主动多域学习方法与最新的主动学习方法的性能进行了比对,实验结果表明,本文提出的主动多域学习方法在减少人工标注工作量方面有显著作用。

English Abstract

参考文献 (0)

目录

/

返回文章
返回