典型文献
面向小样本情感分类任务的弱监督对比学习框架
文献摘要:
文本情感分类是自然语言处理领域的挑战性研究课题.基于词典的方法和传统基于机器学习方法分别依赖高质量的情感词典和鲁棒的特征工程,而多数深度学习方法的性能则依赖大规模人工标注数据集.幸运的是,不同社交平台用户生成了大量带标签的舆情文本,这些文本可以作为弱标注数据集被用于情感分类任务,但是弱标注数据集中的噪声样本会对训练过程产生负面影响.提出了一种用于小样本情感分类任务的弱监督对比学习(weakly-supervised contrastive learning,WCL)框架,旨在学习海量带噪声的用户标记数据中的情感语义,同时挖掘少量人工标注数据中潜在的类间对比模式.该框架包括2个步骤:首先,设计了一种弱监督预训练策略来削弱噪声数据的影响;其次,在有监督微调阶段引入对比学习策略来捕获少量有标注数据的对比模式.在亚马逊评论数据集上评估了所提出的方法,实验结果表明所提出的方法显著优于其他同类对比方法.在仅使用0.5%(即32个样本)比例的有标注数据集进行微调的情况下,所提出方法的性能依然超出其他深度方法.
文献关键词:
情感分类;弱监督学习;有监督对比学习;小样本学习;迁移学习
中图分类号:
作者姓名:
卢绍帅;陈龙;卢光跃;管子玉;谢飞
作者机构:
西安邮电大学通信与信息工程学院 西安 710121;西安电子科技大学计算机科学与技术学院 西安 710071;西安电子科技大学前沿交叉研究院 西安 710071
文献出处:
引用格式:
[1]卢绍帅;陈龙;卢光跃;管子玉;谢飞-.面向小样本情感分类任务的弱监督对比学习框架)[J].计算机研究与发展,2022(09):2003-2014
A类:
WCL,有监督对比学习
B类:
分类任务,文本情感分类,自然语言处理,研究课题,基于机器学习,机器学习方法,情感词典,特征工程,深度学习方法,幸运,社交平台,舆情文本,训练过程,weakly,supervised,contrastive,learning,记数,情感语义,预训练,训练策略,噪声数据,微调,学习策略,亚马逊,评论数据,法显,比方,弱监督学习,小样本学习,迁移学习
AB值:
0.31387
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。