典型文献
一种通过评价类别分类提升评价对象抽取性能的方法
文献摘要:
评价对象抽取主要用于文本的意见挖掘,旨在发掘评论文本中的评价对象实体.基于无监督的自编码器方法可以识别评论语料库中潜藏的主题信息,且无需人工标注语料,但自编码器抽取的评价对象缺乏多样性.提出一种基于监督学习的句子级分类任务和无监督学习自编码器混合模型.该模型通过训练一个分类器生成评价对象类别,对自编码器共享分类任务中的LSTM-Attention结构进行编码得到句向量表征,以增加语义关联度,根据得到的评价对象类别将句向量表征转化为中间层语义向量,从而捕捉到评价对象类别与评价对象之间的相关性,提高编码器的编码能力,最终通过对句向量的重构进行解码得到评价对象矩阵,并依据计算评价对象矩阵与句中单词的余弦相似度完成评价对象的抽取.在多领域评论语料库上的实验结果表明,与k-means、LocLDA等方法相比,该方法评价指标在餐厅领域中提升了3.7%,在酒店领域中提升了2.1%,可有效解决训练过程缺少评价类别多样性的问题,具有较好的评价对象抽取能力.
文献关键词:
自编码器;注意力机制;句子分类;长短期记忆模型;评价对象抽取
中图分类号:
作者姓名:
崔伟琪;严馨;滕磊;陈玮;徐广义
作者机构:
昆明理工大学 信息工程与自动化学院,昆明 650504;昆明理工大学 云南省人工智能重点实验室,昆明 650504;湖南快乐阳光互动娱乐传媒有限公司,长沙 410000;云南南天电子信息产业股份有限公司,昆明 650040
文献出处:
引用格式:
[1]崔伟琪;严馨;滕磊;陈玮;徐广义-.一种通过评价类别分类提升评价对象抽取性能的方法)[J].计算机工程,2022(11):96-103,136
A类:
LocLDA,句子分类
B类:
分类提升,评价对象抽取,评论文本,自编码器,论语,语料库,潜藏,句子级,分类任务,无监督学习,混合模型,分类器,Attention,句向量,向量表征,语义关联,中间层,捕捉到,编码能力,对句,解码,单词,余弦相似度,means,方法评价,餐厅,酒店,训练过程,注意力机制,长短期记忆模型
AB值:
0.255279
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。