典型文献
基于策略记忆的深度强化学习序列推荐算法研究
文献摘要:
推荐系统旨在从用户-项目的交互中进行建模,为用户推荐感兴趣的内容,从而提高用户体验.然而大多数用户-项目的序列并不总是顺序相关的,而是有更灵活的顺序甚至存在噪声.为解决这一问题,提出一种基于策略记忆的深度强化学习序列推荐算法,该算法将用户的历史交互存入记忆网络,使用一个策略网络将用户当前的行为模式更细致地划分为短期偏好、长期偏好以及全局偏好,并引入注意力机制,生成相应的用户记忆向量,利用深度强化学习算法识别对未来收益较大的项目.在用户和项目的交互中不断更新、强化学习网络的策略以提高推荐准确性.在两个公共数据集的实验中表明,本文所提出的算法与最先进的基线算法相比,召回率指标在2个数据集上分别提升了8.87%和11.20%.
文献关键词:
推荐系统;强化学习;策略网络;注意力机制
中图分类号:
作者姓名:
陈卓;姜伟豪;杜军威
作者机构:
青岛科技大学信息科学技术学院,山东青岛266061
文献出处:
引用格式:
[1]陈卓;姜伟豪;杜军威-.基于策略记忆的深度强化学习序列推荐算法研究)[J].湖南大学学报(自然科学版),2022(08):208-216
A类:
B类:
略记,学习序列,序列推荐,推荐算法,算法研究,推荐系统,用户推荐,感兴趣,用户体验,更灵,存入,记忆网络,策略网络,行为模式,短期偏好,长期偏好,注意力机制,用户记忆,深度强化学习算法,算法识别,未来收益,不断更新,学习网络,公共数据,最先,基线算法,召回率
AB值:
0.411291
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。