首站-论文投稿智能助手
典型文献
MSML-BERT模型的层级多标签文本分类方法研究
文献摘要:
层级多标签文本分类相比普通的多标签文本分类更具有挑战性,因为文本的多个标签组织成树状的层次结构.当前方法使用相同的模型结构来预测不同层级的标签,忽略了它们之间的差异性和多样性.并且没有充分地建模层级依赖关系,造成各层级标签尤其是下层长尾标签的预测性能差,且会导致标签不一致性问题.为了解决以上问题,将多任务学习架构引入,提出了MSML-BERT模型.该模型将标签结构中每一层的标签分类网络视为一个学习任务,通过任务间知识的共享和传递,提高各层级任务的性能.基于此,设计了多尺度特征抽取模块,用于捕捉不同尺度和粒度的特征以形成不同层级需要的各种知识.进一步,设计了多层级信息传播模块,用于充分建模层级依赖,在不同层级之间传递知识,以帮助下层任务.在该模块中,设计了层次化门控机制,为了过滤不同层级任务之间的知识流动.在RCV1-V2、NYT和WOS数据集上进行了充分的实验,结果显示该模型的总体表现尤其是在下层长尾标签上的表现超过了其他主流模型,并且能维持较低的标签不一致比率.
文献关键词:
层级多标签文本分类;多任务学习架构;B E RT;多尺度特征抽取模块;多层级信息传播模块
作者姓名:
黄伟;刘贵全
作者机构:
中国科学技术大学 大数据学院,合肥 230027;中国科学技术大学 大数据分析与应用安徽省重点实验室,合肥 230027;中国科学技术大学 计算机科学与技术学院,合肥 230027
引用格式:
[1]黄伟;刘贵全-.MSML-BERT模型的层级多标签文本分类方法研究)[J].计算机工程与应用,2022(15):191-201
A类:
MSML,层级多标签文本分类,多任务学习架构,多尺度特征抽取模块,多层级信息传播模块
B类:
BERT,文本分类方法,标签组,织成,树状,层次结构,前方,模型结构,依赖关系,长尾,尾标,预测性能,不一致性,一致性问题,标签分类,分类网络,学习任务,级任务,不同尺度,层次化,门控机制,知识流动,RCV1,V2,NYT,WOS,签上,流模型
AB值:
0.218014
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。