首站-论文投稿智能助手
典型文献
基于BERT和深度主动学习的农业新闻文本分类方法
文献摘要:
[目的/意义]当前农业新闻分类研究中的模型训练以被动学习方式居多,普遍存在数据无法即时标注及标注成本过高的问题,对农业新闻分析工作也造成了一定阻碍.为解决该问题,运用主动学习或者深度主动学习技术从未标注数据中选择更有价值和代表性的数据进行人工标注并构建标注数据集,提升农业新闻挖掘工作效率和效果.[方法/过程]将文本分类常用的机器学习模型结合主动学习方法分析提升效果,以及使用BERT模型结合3种采样策略进行深度主动学习训练,在共19847条样本的新闻爬虫语料上以筛选出农业相关新闻为目标,通过每轮增加30个样本标注的迭代实验进行测试.[结果/结论]实验结果表明:主动学习方法的应用对各个模型的训练过程均有明显提升.其中BERT模型配合判别性主动学习采样函数,具有最优的新闻文本分类效果和最低的标注数据需求.
文献关键词:
深度学习;农业新闻;文本分类;BERT模型;主动学习
作者姓名:
石运来;崔运鹏;杜志钢
作者机构:
中国农业科学院农业信息研究所,北京 100081;淄博市数字农业农村发展中心,淄博 255000
引用格式:
[1]石运来;崔运鹏;杜志钢-.基于BERT和深度主动学习的农业新闻文本分类方法)[J].农业图书情报学报,2022(08):19-29
A类:
新闻分析
B类:
BERT,主动学习,农业新闻,新闻文本分类,文本分类方法,分类研究,模型训练,学习方式,时标,分析工作,学习技术,从未,新闻挖掘,机器学习模型,提升效果,采样策略,学习训练,爬虫,语料,样本标注,训练过程,判别性,分类效果,数据需求
AB值:
0.31741
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。