典型文献
基于Multi-Aspect的融合网络用户画像生成方法
文献摘要:
在大数据时代,用户画像对于企业了解并获取目标用户的重要性日益提升,但基于统计的用户画像方法无法处理非结构化的文本数据,而传统的基于模型的用户画像方法亦无法从多角度深层次提取用户特征.为实现更加全面且精准的用户属性预测,该文提出一种基于多层级特征提取的融合网络用户画像生成方法,通过对用户原始文本关键词的提取和排序,分别生成基于top 2关键词的子句表示和top N关键词的词向量,并结合循环神经网络和注意力机制,构建多层次用户特征提取的分类模型,利用原始用户数据进行用户属性预测.在搜狗用户搜索文本数据集上的实验表明,文中模型较其他基线模型在分类准确率上显著提升,达到0.73,通过消融实验进一步表明各个模块均为有效提取用户特征从而提升分类准确率发挥了重要作用.
文献关键词:
用户画像;多层级特征提取;关键词抽取;循环神经网络;注意力机制
中图分类号:
作者姓名:
苗宇;金醒男;杜永萍
作者机构:
北京工业大学 信息学部,北京 100124
文献出处:
引用格式:
[1]苗宇;金醒男;杜永萍-.基于Multi-Aspect的融合网络用户画像生成方法)[J].计算机技术与发展,2022(08):20-25
A类:
多层级特征提取
B类:
Multi,Aspect,融合网络,网络用户,用户画像,生成方法,非结构化,文本数据,基于模型,取用,用户特征,用户属性,属性预测,文本关键词,top,子句,词向量,循环神经网络,注意力机制,分类模型,用户数据,搜狗,基线模型,分类准确率,消融实验,有效提取,关键词抽取
AB值:
0.31618
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。