基于MFFMB的电商评论文本分类研究|谢星雨;余本功|过程优化与智能决策教育部重点实验室合肥 230009 - 期刊导航|首站-论文投稿智能助手|论文发表|论文智能投稿|期刊自助发表推荐|杂志社快速发表|查同导刊-域田数据官方网站

典型文献

基于MFFMB的电商评论文本分类研究

文献摘要：

[目的]为缓解在公开论坛、企业后台数据仓库的数据自动化分类及存储过程中,由于电商评论文本具有一词多义、信息分布稀疏等特点而造成的处理困难,本文设计基于B E RT语言模型和多通道特征抽取的文本分类模型,实现评论文本的自动化分类.[方法]考虑到中文文本的最小表达单元是字,通过B E RT的字向量编码联动TextCNN缓解一词多义的问题.为捕获长距离上下文语义信息,模型设计了BERT联动Bi-LSTM的通道.充分利用BERT的微调机制,使字向量编码根据两个通道的特征抽取方式进行调整,从而得到适配局部和长距离特征抽取的字向量编码结果.模型最终融合两个通道的特征向量,完成文本分类任务.[结果]本文提出的MFFMB(Multi-Features Fusion Model BERT-based)模型在公开的电子商务评论多分类数据集上的准确率高达0.9007,相对于基线模型BERT+TextCNN、BERT+BiLSTM、BERT+LSTM+MaxPooling、BERT+LSTM+Attention分别提升2.36、8.55、4.61、5.11个百分点.同时,实验结果说明BERT和注意力机制的引入,相对于基线模型中的较优者,准确率分别提升约1.48和4.81个百分点.[局限]注意力机制仅在BiLSTM通道引入,没有在全局设计;本文模型未在更多数据集上验证效果.[结论]本文模型能够更好地结合多维度信息,更加充分地挖掘B E RT预训练模型在文本分类任务上的作用,提高了分类的准确性.

文献关键词：

BERT;多粒度特征融合;长短时记忆网络;注意力机制;文本分类

中图分类号：

[1] 自动化技术、计算机技术（TP） / 计算技术、计算机技术（TP3） / 计算机的应用（TP39） / 信息处理(信息加工)（TP391） / 文字信息处理（TP391.1）

[2] 自动化技术、计算机技术（TP） / 计算技术、计算机技术（TP3） / 计算机的应用（TP39） / 信息处理(信息加工)（TP391）

[3] 自动化技术、计算机技术（TP） / 自动化基础理论（TP1） / 人工智能理论（TP18） / 人工神经网络与计算（TP183）

作者姓名：

谢星雨;余本功

作者机构：

合肥工业大学管理学院合肥 230009;过程优化与智能决策教育部重点实验室合肥 230009

文献出处：

数据分析与知识发现

引用格式：

[1]谢星雨;余本功-.基于MFFMB的电商评论文本分类研究)[J].数据分析与知识发现,2022(01):101-112

A类：

MFFMB,BERT+TextCNN,BERT+LSTM+MaxPooling,BERT+LSTM+Attention

B类：

电商评论,评论文本,文本分类,分类研究,后台数据,数据仓库,存储过程,一词多义,信息分布,语言模型,多通道特征,特征抽取,分类模型,中文文本,字向量,向量编码,长距离,上下文语义,语义信息,模型设计,微调,调机,距离特征,特征向量,成文,分类任务,Multi,Features,Fusion,Model,多分类,分类数据,基线模型,BERT+BiLSTM,百分点,注意力机制,优者,全局设计,未在,多维度信息,预训练模型,多粒度特征融合,长短时记忆网络

AB值：

0.32334

相似文献

融合BERT与标签语义注意力的文本多标签分类方法

吕学强;彭郴;张乐;董志安;游新冬-网络文化与数字传播北京市重点实验室(北京信息科技大学),北京100101

知识图谱增强的科普文本分类模型

唐望径;许斌;仝美涵;韩美奂;王黎明;钟琦-清华大学计算机科学与技术系,北京100084;北京交通大学计算机与信息技术学院,北京100044;清华大学深圳国际研究生院,广东深圳518055;中国科普研究所,北京100081

基于情感词典和堆叠残差的双向长短期记忆网络的情感分析

罗浩然;杨青-华中师范大学伍伦贡联合研究院,武汉430079;华中师范大学计算机学院,武汉430079;国家语言资源监测与研究网络媒体中心,武汉430077

融合字注释的文本分类模型

杨先凤;赵家和;李自强-西南石油大学计算机科学学院,成都610500;四川师范大学影视与传媒学院,成都610066

多头注意力与字词融合的中文命名实体识别