基于读者兴趣挖掘的深度学习推荐模型

刘园园

doi:10.13718/j.cnki.xdzk.2023.04.019

基于读者兴趣挖掘的深度学习推荐模型

刘园园

武汉轻工大学图书馆，武汉 430023

基金项目: 国家自然科学基金项目(61906140); 湖北省自然科学基金杰出青年项目(2020CFA063); 武汉轻工大学高等教育研究一般项目(2020GJKT013)

详细信息

作者简介:
刘园园，硕士研究生，主要从事推荐算法及数字图书馆研究 .

中图分类号: TP391

Deep Learning Recommendation Algorithm Based on Reader Preference Analysis

LIU Yuanyuan

Library, Wuhan Polytechnic University, Wuhan 430023, China

摘要: 传统的推荐算法面临数据稀疏、泛化能力不强等问题，导致推荐准确率不高. 近10年来深度学习由于较强的表达能力以及灵活的模型结构成为了最热门的研究方向. 该文提出一种基于读者兴趣挖掘的深度学习推荐模型(Deep Reader Preference Ming For Book Recommendation，DRPM)，该算法运用自然语言处理技术提取图书丰富的语义特征，利用长短时记忆网络模型对读者历史借阅记录进行建模，分析读者兴趣，并引入注意力机制使图书与读者进行有效交互，挖掘读者动态阅读兴趣，分析读者借阅偏好，从而提供更加精准的图书推荐服务. 对武汉轻工大学图书馆5年真实数据的实验结果表明，该文所提出的DRPM模型比基线模型在命中率(HR)和归一化折损累积增益(NDCG)评价指标上有较大提升.
- 推荐算法 /
- 深度学习 /
- 自然语言处理 /
- 长短时记忆网络 /
- 注意力机制
Abstract: Traditional recommendation algorithms face problems such as sparse data and weak generalization ability, resulting in low recommendation accuracy. In the past decade, deep learning has become the most popular research direction due to its strong expression ability and flexible model structure. In this paper, a deep reader preference ming for book recommendation (DRPM) is proposed. Natural language processing technology is used to extract rich semantic features of books. The LSTM is used to model readers' historical borrowing records and analyzes readers' interests. In addition, attention mechanism is introduced to realize the effective interaction between books and readers, excavate readers' dynamic reading interests and analyze readers' borrowing preferences, so as to provide more accurate book recommendation services. Result of experiments on dataset of Wuhan Polytechnic University Library shows that the DRPM model proposed in this paper has a greater improvement in the evaluation of HR and NDCG indicators compared to the baseline model.
- recommendation algorithm /
- deep learning /
- natural language processing /
- Long Short-Term Memory /
- attention .

图 1 BERT网络结构

下载: 全尺寸图片幻灯片

图 2 LSTM在t时刻的网络结构

下载: 全尺寸图片幻灯片

图 3 查询及键-值对映射关系

下载: 全尺寸图片幻灯片

图 4 DRPM模型

下载: 全尺寸图片幻灯片

图 5 不同负采样率的评价指标

下载: 全尺寸图片幻灯片

图 6 模型对比结果

下载: 全尺寸图片幻灯片

表 1 实验数据详情

	读者人数	数据集大小
	读者人数	训练集	测试集	合计
正样本	736	6624	736	7 360
负样本	736	33 120	36 800	69 920
总计	736	39 744	37 536	77 280

下载: 导出CSV

表 2 不同隐藏层的评价指标

隐藏层	HR@10	NDCG@10
无	0.583	0.352
8 ReLU	0.632	0.413
16 ReLU	0.657	0.433
32 ReLU	0.688	0.452
16 ReLU+8 ReLU	0.723	0.486
32 ReLU+16 ReLU	0.731	0.512
32 ReLU+16 ReLU+8 ReLU	0.743	0.532

下载: 导出CSV

[1]	KARATZOGLOU A, HIDASI B. Deep Learning for Recommender Systems [C] //Proceedingsof the Eleventh ACM Conference on Recommender Systems. New York: Association for Computing Machinery, 2017.
[2]	BRANDÃO M G, PAULO P J, HOJJAT A. Deep Learning Techniques for Recommender Systems Based on Collaborative Filtering [J]. Expert Systems, 2020, 37(6): 1-21.
[3]	MAKKAR A, KUMAR N. User Behavior Analysis-Based Smart Energy Management for Webpage Ranking: Learning Automata-Based Solution [J]. Sustainable Computing: Informatics and Systems, 2018, 20: 174-191. doi: 10.1016/j.suscom.2018.02.003
[4]	HAO X, HAN S. An Algorithm for Generating a Recommended Rule Set Based on Learner's Browse Interest [J]. International Journal of Emerging Technologies in Learning, 2018, 13(11): 102-116. doi: 10.3991/ijet.v13i11.9604
[5]	谢金峰. 基于行为序列的用户兴趣挖掘研究[D]. 哈尔滨: 哈尔滨工程大学, 2019.
[6]	刘丰. 基于用户行为序列挖掘的个性化推荐方法研究[D]. 哈尔滨: 哈尔滨工业大学, 2021.
[7]	程思, 陶宏才. 一种融合时间权值和用户行为序列的电影推荐模型[J]. 成都信息工程大学学报, 2022, 37(3): 241-247. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-CDQX202203001.htm
[8]	汪菁瑶, 吴国栋, 范维成, 等. 用户行为序列个性化推荐研究综述[J]. 小型微型计算机系统, 2022, 43(5): 921-935. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-XXWX202205004.htm
[9]	段超, 张婧, 何彬, 等. 融合注意力机制的深度混合推荐算法[J]. 计算机应用研究, 2021, 38(9): 2624-2627, 2634. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-JSYJ202109011.htm
[10]	陶涛, 郑凯, 王一蕾, 等. 基于翻译结构的相对位置注意力机制推荐模型[J]. 计算机工程与设计, 2021, 42(10): 2917-2923. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-SJSJ202110030.htm
[11]	任胜兰, 郭慧娟, 黄文豪, 等. 基于注意力机制交互卷积神经网络的推荐方法[J]. 计算机科学, 2022, 49(10): 126-131. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-JSJA202210016.htm
[12]	张若琦, 申建芳, 陈平华. 结合GNN、Bi-GRU及注意力机制的会话序列推荐[J]. 数据分析与知识发现, 2022, 6(6): 46-54. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-XDTQ202206005.htm
[13]	刘羽茜, 刘玉奇, 张宗霖, 等. 注入注意力机制的深度特征融合新闻推荐模型[J]. 计算机应用, 2022, 42(2): 426-432. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-JSJY202202013.htm
[14]	于蒙, 蔡利平, 周绪川, 等. 融合注意力机制的深度学习推荐模型[J]. 西南民族大学学报(自然科学版), 2022, 48(5): 550-560. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-XNMZ202205012.htm
[15]	孙守川. 基于深度学习的读者检索借阅研究[D]. 兰州: 兰州交通大学, 2015.
[16]	尹婷婷, 曾宪玉. 深度学习视角下图书馆馆藏资源推荐模型设计与分析[J]. 现代情报, 2019, 39(4): 103-107, 124. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-XDQB201904012.htm
[17]	丁永刚, 张雨琴, 付强, 等. 基于SOM神经网络和排序因子分解机的图书资源精准推荐[J]. 情报理论与实践, 2019, 42(9): 133-138, 170. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-QBLL201909024.htm
[18]	沈凌云. 基于深度学习的图书馆借阅推荐方法研究[D]. 上海: 上海财经大学, 2020.
[19]	黄禹, 张文德, 张诗雨. 基于深度距离分解的在线图书资源个性化推荐研究[J]. 情报科学, 2021, 39(3): 76-81. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-QBKX202103011.htm
[20]	DEVLIN J, CHANG M W, LEE K, et al. Bert: Pre-Training of Deep Bidirectional Transformers for Language Understanding [C] //Proceedings of the Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies. Minneapolis: Association for Computational Linguistics, 2019.
[21]	HOCHREITER S, SCHMIDHUBER J. Long Short-Term Memory [J]. Oral Oncology, 1997, 9(8): 1735-1780.
[22]	BAHDANAU D, CHO K, BENGIO Y. Neural Machine Translation by Jointly Learning to Align and Translate [C]. San Diego: Proceedings of the International Conference on Learning Representations, 2015.
[23]	XIAO J, YE H, HE X N, et al. Attentional Factorization Machines: Learning the Weight of Feature Interactions Via Attention Networks [C] //Proceedings of the 26th International Joint Conference on Artificial Intelligence. Palo Alto: AAAI Press, 2017.
[24]	ZHOU G R, SONG C R, ZHU X Q, et al. Deep Interest Network for Click-Through Rate Prediction [C] //Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. New York: ACM, 2018.
[25]	陈海涵, 吴国栋, 李景霞, 等. 基于注意力机制的深度学习推荐研究进展[J]. 计算机工程与科学, 2021, 43(2): 370-380. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-JSJK202102024.htm
[26]	高广尚. 深度学习推荐模型中的注意力机制研究综述[J]. 计算机工程与应用, 2022, 58(9): 9-18. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-JSGG202209001.htm
[27]	LINDEN G, SMITH B, YORK J. Amazon. com Recommendations: Item-to-Item Collaborative Filtering [J]. IEEE Internet Computing, 2003, 7(1): 76-80.
[28]	KOREN Y, BELL R, VOLINSKY C. Matrix Factorization Techniques for Recommender Systems [J]. Computer, 2009, 42(8): 30-37.

图( 6) 表( 2)

计量

文章访问数: 1022
HTML全文浏览数: 1022
PDF下载数: 317
施引文献: 0

全文HTML

开放科学(资源服务)标志码(OSID):
在信息时代，推荐系统作为缓解信息过载的重要手段，已经成为所有新闻、视频、音频、电商、互联网金融等相关平台的标配. 目前正处于一个被推荐系统影响的时代，推荐系统已经渗透到我们生活的方方面面. 个性化推荐从1992年诞生至今，经过30年的不断累积和沉淀，受到越来越广泛的关注和重视，已经发展成为了一门独立的学科.

传统的推荐算法，一般根据用户隐向量和物品隐向量的相似度进行物品推荐，虽然简单易懂且计算复杂度低，却十分依赖用户和物品的交互关系，一旦用户和物品的交互关系十分稀疏将会出现物品冷启动问题; 同时传统的推荐算法利用的信息一般是单维数据，无法做到多方面、多维度数据的融合. 深度学习具有更强的表达能力，无论是对数据的拟合能力或是对数据特征的挖掘能力都要强于传统模型，近10年已经成为最热门的研究方向，学者们将深度学习技术引入到推荐算法中，展开了相关研究. Karatzoglou等^[1]对深度学习技术在推荐算法中的应用进行了详细介绍; Brandāo等^[2]认为协同过滤算法与深度学习相结合，是推荐算法研究的热门方向; Makkar等^[3]将用户在网页停留时间以及页面点击的次数作为衡量用户对该网页感兴趣的程度; Hao等^[4]根据用户的滚条拉动次数和用户在网页逗留时间建立线性回归方程来预测用户偏好; 谢金峰^[5]、刘丰^[6]、程思等^[7]、汪菁瑶等^[8]研究用户的行为序列来提取用户兴趣，达到提高推荐准确率的目的; 段超等^[9]、陶涛等^[10]、任胜兰等^[11]、张若琦等^[12]、刘羽茜等^[13]、于蒙等^[14]尝试在推荐系统中引入注意力机制提升推荐效率. 在图书推荐领域，孙守川^[15]将深度学习与协同过滤算法相结合，建立读者检索借阅模型; 尹婷婷等^[16]针对读者兴趣，提出了一种基于深度学习的馆藏资源推荐模型; 丁永刚等^[17]利用用户学术背景信息，通过SOM(Self-organizing feature Map)神经网络对读者进行聚类，并融入多种特征信息实现图书资源推荐; 沈凌云^[18]利用Word2vec提取图书语义特征，采用长短时记忆网络(Long Short-Term Memory，LSTM)对读者借阅行为进行建模; 黄禹等^[19]为了计算评分时能够融合更多层的特征，基于深度学习框架改进了矩阵分解算法. 然而，目前深度学习技术大多应用在商品、电影、音乐等领域，在图书领域的应用研究较少，且在已开展的图书推荐应用研究中，存在图书特征提取不够充分、忽视读者行为序列与候选图书的关系、未区分读者对不同图书的偏好等问题. 为此，本文提出了基于读者兴趣挖掘的深度学习推荐模型.

1) 在标准深度学习推荐模型的基础上，基于图书丰富的文本特征，利用谷歌提供的预训练BERT(Bidirectional Encoder Representations from Transformers)模型对图书书名、图书内容摘要等语义特征生成向量表示; 采用长短时记忆网络(LSTM)模型对读者历史借阅记录进行建模; 引入注意力Attention机制为不同图书分配不同权重，为读者“下一次借阅”实现更精准的推荐. 为了缓解新用户冷启动问题，将教材信息引入了读者借阅记录中，在新读者缺少历史借阅行为时，能根据其专业背景提供相关图书推荐.

2) 为了选择最优模型参数，进行了大量的模型训练实验. 通过对不同的负采样比例、隐藏层设置、迭代次数等模型参数进行实验，最终确定正负样本比例为1∶5，隐藏层设置为32 RuLU+16 ReLU+8 ReLU，模型迭代5次，推荐长度为10的参数设置为最优设置，并与不同算法进行对照实验.

4. 结语

本研究基于深度学习技术，提出了基于读者兴趣挖掘的深度学习推荐模型. 该模型运用自然语言处理技术中的BERT模型对图书文本特征进行向量表示; 采用LSTM模型学习读者的借阅历史，分析读者借阅偏好; 引入注意力机制学习读者兴趣演化，为读者的借阅行为赋予不同的权重，挖掘读者动态的兴趣向量. 同时将教材信息引入读者借阅记录中，缓解了读者冷启动问题. 实验结果表明，该模型在图书推荐上效果好于其他对比模型.

未来的工作将在提高模型可解释性方面进行探索. 可解释性推荐也是目前推荐算法中一个重要的研究方向，解释性强的推荐会增加用户满意度和信任度，从而提高推荐说服力和推荐成功率，未来会尝试在本研究的基础上进行该方面的探索.

参考文献 (28)

姓名
	姓名不能为空！
邮箱
	邮箱不能为空！非法的邮箱地址。
手机号码
	电话不能为空！请输入有效手机号!
标题
	标题不能为空！
留言内容
	内容不能为空！
验证码
	验证码不能为空！验证码错误！

留言板

基于读者兴趣挖掘的深度学习推荐模型

武汉轻工大学图书馆，武汉 430023

作者简介:
刘园园，硕士研究生，主要从事推荐算法及数字图书馆研究 .

Deep Learning Recommendation Algorithm Based on Reader Preference Analysis

Library, Wuhan Polytechnic University, Wuhan 430023, China

计量

基于读者兴趣挖掘的深度学习推荐模型

作者简介: 刘园园，硕士研究生，主要从事推荐算法及数字图书馆研究
武汉轻工大学图书馆，武汉 430023

English Abstract

Deep Learning Recommendation Algorithm Based on Reader Preference Analysis

全文HTML

1.1. BERT预训练模型

1.2. LSTM网络

1.3. Attention机制

2.1. 输入层

2.2. 特征提取层

2.3. 偏好提取层

2.3.1. LSTM兴趣提取

2.3.2. 引入注意力机制的偏好提取

3.1. 实验环境

3.2. 实验数据与数据预处理

3.3. 目标函数

3.4. 评价指标

3.5. 超参数选择

3.5.1. 负采样比例

3.5.2. 多层感知机隐藏层设置

3.6. 对比实验结果

目录

留言板

基于读者兴趣挖掘的深度学习推荐模型

武汉轻工大学 图书馆，武汉 430023

作者简介: 刘园园，硕士研究生，主要从事推荐算法及数字图书馆研究 .

Deep Learning Recommendation Algorithm Based on Reader Preference Analysis

Library, Wuhan Polytechnic University, Wuhan 430023, China

计量

出版历程

基于读者兴趣挖掘的深度学习推荐模型

作者简介: 刘园园，硕士研究生，主要从事推荐算法及数字图书馆研究 武汉轻工大学 图书馆，武汉 430023

English Abstract

Deep Learning Recommendation Algorithm Based on Reader Preference Analysis

全文HTML

1.1. BERT预训练模型

1.2. LSTM网络

1.3. Attention机制

2.1. 输入层

2.2. 特征提取层

2.3. 偏好提取层

2.3.1. LSTM兴趣提取

2.3.2. 引入注意力机制的偏好提取

3.1. 实验环境

3.2. 实验数据与数据预处理

3.3. 目标函数

3.4. 评价指标

3.5. 超参数选择

3.5.1. 负采样比例

3.5.2. 多层感知机隐藏层设置

3.6. 对比实验结果

目录

武汉轻工大学图书馆，武汉 430023

作者简介:
刘园园，硕士研究生，主要从事推荐算法及数字图书馆研究 .

作者简介: 刘园园，硕士研究生，主要从事推荐算法及数字图书馆研究
武汉轻工大学图书馆，武汉 430023