首站-论文投稿智能助手
典型文献
基于文本增强的民航安全信息自动分类
文献摘要:
针对民航安全信息自动分类应用中存在样本量不足的问题,利用基于变换器的双向编码器表示技术(BERT,bidirectional encoder representations from transformers)预训练模型和简单数据增强(EDA,easy data augment)算法对中国民用航空安全信息系统中的不安全事件信息按单事件类型的事件信息数量级划分出不同数量级的子集,构造支持向量机(SVM,support vector machine)自动分类器,分析不同数量级对应的数据集在模型上的性能表现及在小数据集上的性能提升.结果表明,加权F1(F1w)在单事件类型事件数量为十数量级时提升31.21%,百数量级时提升9.66%,千数量级时提升3.35%.该方法在相对较小的样本集上训练的分类器效果较好,可用于民航安全信息自动分类.
文献关键词:
民航安全;安全信息;文本增强;自然语言处理
作者姓名:
崔振新;张卓言
作者机构:
中国民航大学飞行技术学院,天津 300300
引用格式:
[1]崔振新;张卓言-.基于文本增强的民航安全信息自动分类)[J].中国民航大学学报,2022(03):47-53,64
A类:
简单数据增强,F1w,千数
B类:
文本增强,民航安全,安全信息,信息自动分类,样本量,基于变换器的双向编码器表示技术,BERT,bidirectional,encoder,representations,from,transformers,预训练模型,EDA,easy,data,augment,民用航空,航空安全,不安全事件,事件类型,信息数量,数量级,分出,子集,support,vector,machine,分类器,小数据,性能提升,件数,十数,百数,样本集,自然语言处理
AB值:
0.362785
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。