典型文献
基于MFFMB的电商评论文本分类研究
文献摘要:
[目的]为缓解在公开论坛、企业后台数据仓库的数据自动化分类及存储过程中,由于电商评论文本具有一词多义、信息分布稀疏等特点而造成的处理困难,本文设计基于B E RT语言模型和多通道特征抽取的文本分类模型,实现评论文本的自动化分类.[方法]考虑到中文文本的最小表达单元是字,通过B E RT的字向量编码联动TextCNN缓解一词多义的问题.为捕获长距离上下文语义信息,模型设计了BERT联动Bi-LSTM的通道.充分利用BERT的微调机制,使字向量编码根据两个通道的特征抽取方式进行调整,从而得到适配局部和长距离特征抽取的字向量编码结果.模型最终融合两个通道的特征向量,完成文本分类任务.[结果]本文提出的MFFMB(Multi-Features Fusion Model BERT-based)模型在公开的电子商务评论多分类数据集上的准确率高达0.9007,相对于基线模型BERT+TextCNN、BERT+BiLSTM、BERT+LSTM+MaxPooling、BERT+LSTM+Attention分别提升2.36、8.55、4.61、5.11个百分点.同时,实验结果说明BERT和注意力机制的引入,相对于基线模型中的较优者,准确率分别提升约1.48和4.81个百分点.[局限]注意力机制仅在BiLSTM通道引入,没有在全局设计;本文模型未在更多数据集上验证效果.[结论]本文模型能够更好地结合多维度信息,更加充分地挖掘B E RT预训练模型在文本分类任务上的作用,提高了分类的准确性.
文献关键词:
BERT;多粒度特征融合;长短时记忆网络;注意力机制;文本分类
中图分类号:
作者姓名:
谢星雨;余本功
作者机构:
合肥工业大学管理学院 合肥 230009;过程优化与智能决策教育部重点实验室 合肥 230009
文献出处:
引用格式:
[1]谢星雨;余本功-.基于MFFMB的电商评论文本分类研究)[J].数据分析与知识发现,2022(01):101-112
A类:
MFFMB,BERT+TextCNN,BERT+LSTM+MaxPooling,BERT+LSTM+Attention
B类:
电商评论,评论文本,文本分类,分类研究,后台数据,数据仓库,存储过程,一词多义,信息分布,语言模型,多通道特征,特征抽取,分类模型,中文文本,字向量,向量编码,长距离,上下文语义,语义信息,模型设计,微调,调机,距离特征,特征向量,成文,分类任务,Multi,Features,Fusion,Model,多分类,分类数据,基线模型,BERT+BiLSTM,百分点,注意力机制,优者,全局设计,未在,多维度信息,预训练模型,多粒度特征融合,长短时记忆网络
AB值:
0.32334
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。