典型文献
融合BTM和BERT的短文本分类方法
文献摘要:
为充分提取短文本语义信息,提高短文本分类精度,提出一种融合BTM和BERT的短文本分类方法BTM&BERT.综合考虑文本主题特征信息和全局语义信息,利用BTM(biterm topic model)和BERT(bidirectional encoder representations from transformers)完成短文本特征向量构建,实现语义增强,将融合主题特征信息和上下文语义信息的特征向量经全连接和Softmax分类器,获得短文本分类结果.实验结果表明,在真实电力工单短文本数据集上,BTM&BERT较BTM、BTM&Word2Vec、BTM&Doc2Vec和BERT方法具有较好的分类精度和语义表示能力.
文献关键词:
短文本分类;词对主题模型;BERT预训练模型;特征向量拼接;电力工单
中图分类号:
作者姓名:
付文杰;杨迪;马红明;吴迪
作者机构:
国网河北省电力有限公司 营销服务中心,河北 石家庄 050000;河北工程大学 信息与电气工程学院,河北 邯郸 056038
文献出处:
引用格式:
[1]付文杰;杨迪;马红明;吴迪-.融合BTM和BERT的短文本分类方法)[J].计算机工程与设计,2022(12):3421-3427
A类:
电力工单
B类:
BTM,BERT,短文本分类,文本分类方法,分提,文本语义,分类精度,文本主题,主题特征,特征信息,全局语义信息,biterm,topic,model,bidirectional,encoder,representations,from,transformers,文本特征,语义增强,融合主题,上下文语义,全连接,Softmax,分类器,文本数据,Word2Vec,Doc2Vec,示能,词对主题模型,预训练模型,特征向量拼接
AB值:
0.319196
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。