典型文献
基于少样本学习的农业领域短文本分类研究
文献摘要:
为了便捷、准确、高效地识别海量信息中所描述问题的所属类别,解决农业领域短文本分类存在数据稀疏性、高度依赖上下文等问题,爬取了10000多条农业问答领域的短文本,经过清洗、过滤和标注等处理后形成一个5分类的短文本数据集;构建了基于BERT和ERNIE预训练模型的农业短文本分类算法,并与基于决策树模型的农业短文本分类算法进行对比分析.结果表明,随着数据集样本的减少,3种模型的准确率、精确率和召回率均呈下降趋势;基于ERNIE预训练模型的准确率、F1值处于较高水平,远高于同数据的决策树模型,表明构建的农业短文本分类算法能够在数据量不足的情况下依然获得较高的分类效果.
文献关键词:
预训练模型;文本分类;BERT;ERNIE
中图分类号:
作者姓名:
麻之润;费凡;黎芬;董慧洁;彭琳
作者机构:
云南农业大学大数据学院,昆明 650000;绿色农产品大数据智能信息处理工程研究中心,昆明 650000
文献出处:
引用格式:
[1]麻之润;费凡;黎芬;董慧洁;彭琳-.基于少样本学习的农业领域短文本分类研究)[J].湖北农业科学,2022(13):151-155
A类:
农业问答,农业短文本分类
B类:
少样本学习,农业领域,分类研究,类存在,数据稀疏性,上下文,爬取,多条,文本数据,BERT,ERNIE,预训练模型,分类算法,决策树模型,精确率,召回率,数据量,分类效果
AB值:
0.178343
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。