典型文献
一种半监督学习的金融新闻文本分类算法
文献摘要:
对金融文本进行分类是一项常见的用于识别金融风险的任务.传统的金融新闻文本分类方法需要大量的已知类别文本来训练分类器,然而标注金融新闻文本标签不仅需要专业的金融背景知识,而且耗时耗力.为了减少对已知类别文本的依赖,提出了一个基于半监督学习的金融文本分类算法,该算法采用有监督学习和无监督学习的一致性训练方式,以更好地利用未知类别的文本数据;针对金融领域文本引入无监督数据增强方法,即对特定任务使用特定目标的数据增强方法,以产生更有效的数据.在多个金融文本数据集上开展的实验证明,相比其他文本分类算法,提出的算法在有效性上有明显提升.
文献关键词:
自然语言处理;文本分类;半监督学习;金融
中图分类号:
作者姓名:
张晓龙;支龙;高剑;苗仲辰;林越峰;项雅丽;熊贇
作者机构:
复旦大学计算机科学技术学院,上海 210438;上海市数据科学重点实验室,上海 200438;上海金融期货信息技术有限公司,上海 200120
文献出处:
引用格式:
[1]张晓龙;支龙;高剑;苗仲辰;林越峰;项雅丽;熊贇-.一种半监督学习的金融新闻文本分类算法)[J].大数据,2022(02):134-144
A类:
金融文本分类
B类:
半监督学习,金融新闻,新闻文本分类,分类算法,金融风险,文本分类方法,知类,分类器,金融背景,背景知识,耗力,有监督学习,无监督学习,训练方式,文本数据,金融领域,数据增强,增强方法,务使,特定目标,自然语言处理
AB值:
0.248334
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。