典型文献
基于候选主题词与话题分类的人物行为研究
文献摘要:
如何从海量聊天数据获取聊天主题和聊天人物行为是案件智能化分析的热点问题之一.传统词嵌入方法,将文本中的所有词汇映射到向量空间,存在词汇特征冗余的问题.为了缓解这一问题,该文提出一种基于候选主题词的话题分类算法—CTW(candidate topic words).该算法使用LDA主题模型抽取聊天文本中的关键词,使用预训练词向量得到显著的语义特征,同时为增强特征,将字符特征与获取的词汇特征进行融合.传统方法同时还存在只关注话题无法更精确地刻画人物行为的问题.针对该问题,该文提出了同时获取聊天话题和人物行为的方案:针对已归类的话题,该方案使用群成员互动强度、群成员活跃度作为人物行为网络中的权值,构建话题参与人的行为网络图;最后通过成员在群中的备注给人物赋予不同的社会标签,以丰富人物行为.实验表明,提出的话题分类算法,在实际搜集的数据集上比基线模型拥有更佳的性能,在获取群聊话题的同时得到了更丰富的人物行为描述.
文献关键词:
聊天主题;候选主题词;话题分类;人物行为;互动强度;群成员活跃度;社会标签
中图分类号:
作者姓名:
刘晓芳;欧荣安;罗欢;刘芳婷;张辉极;韩冰;赵建强
作者机构:
厦门市美亚柏科信息股份有限公司,福建 厦门361008;广州市刑事科学技术研究所,广东 广州 510030;福州大学,福建 福州 350108;厦门市人民检察院检察技术信息部,福建 厦门 361008;西安电子科技大学,陕西 西安 710071
文献出处:
引用格式:
[1]刘晓芳;欧荣安;罗欢;刘芳婷;张辉极;韩冰;赵建强-.基于候选主题词与话题分类的人物行为研究)[J].计算机技术与发展,2022(04):44-50
A类:
候选主题词,聊天主题,聊天人,CTW,群成员活跃度
B类:
话题分类,人物行为,数据获取,智能化分析,词嵌入,汇映,射到,向量空间,词汇特征,分类算法,candidate,topic,words,LDA,主题模型,模型抽取,天文,预训练,词向量,语义特征,字符,刻画人物,互动强度,权值,参与人,人的行为,网络图,备注,社会标签,富人,比基,基线模型,群聊,行为描述
AB值:
0.289597
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。