典型文献
基于相关修正的无偏排序学习方法
文献摘要:
用户点击数据较文档的相关标签更易被获取且能反映用户兴趣,将其作为标签能够有效降低人工标注成本并且模型能随数据实时更新.但用户点击含有偏差和噪声,因此需设计有效的无偏排序方法.针对无偏排序中对偶学习方法收敛得到次优解从而无法完全消除偏差的问题,提出一种基于相关修正的无偏排序学习方法.首先,利用现有小规模相关标注数据训练排序模型,对候选文档进行较精准的相关得分预测;再基于用户点击和文档相关得分训练点击倾向模型;最后,将得到的模型参数设为对偶去偏初始值并联合训练.该方法不影响模型上线的计算速度,可用于在线学习场景,模拟不同程度偏差噪声并在真实点击场景下进行测试,结果表明该方案能够有效提升现有无偏排序学习方法表现.
文献关键词:
无偏排序学习;点击数据;相关修正;偏差去除;逆倾向加权
中图分类号:
作者姓名:
王奕婷;兰艳艳;庞亮;郭嘉丰;程学旗
作者机构:
中国科学院网络数据科学与技术重点实验室(中国科学院计算技术研究所),北京 100190;中国科学院大学,北京 100049;清华大学智能产业研究院,北京 100084;中国科学院计算技术研究所数据智能系统研究中心,北京 100190
文献出处:
引用格式:
[1]王奕婷;兰艳艳;庞亮;郭嘉丰;程学旗-.基于相关修正的无偏排序学习方法)[J].计算机研究与发展,2022(12):2867-2877
A类:
无偏排序学习,点击数据,对偶学习,偏差去除,逆倾向加权
B类:
相关修正,文档,用户兴趣,实时更新,需设,排序方法,到次,次优,优解,全消,小规模,数据训练,排序模型,选文,关得,得分预测,训练点,去偏,初始值,联合训练,影响模型,计算速度,在线学习,学习场景
AB值:
0.266766
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。