首站-论文投稿智能助手
典型文献
面向规范性文件的基于BERT的文本纠错模型
文献摘要:
针对行政规范性文件的文本纠错任务,提出了基于BERT(Bidirectional Encoder Representations from Trans-formers)的文本纠错模型,模型针对冗余、缺失、错序、错字四类任务分别建模,分为检错和纠错两个阶段.检错阶段检查出文本是否有错、错误的位置以及错误的类型等内容,纠错阶段运用BERT掩码语言模型和混淆集匹配的方法预测文本缺失内容.实验结果表明:新提出的基于BERT的文本纠错模型在行政规范性文件的文本纠错任务中的F1值为71.89%,比经典的中文文本纠错工具Pycorrector提升了 9.48%.
文献关键词:
中文文本纠错;行政规范性文件;BERT;BiLSTM;条件随机场
作者姓名:
汪苏琪;王明文;曾雪强
作者机构:
江西师范大学 计算机信息工程学院,江西 南昌330022
引用格式:
[1]汪苏琪;王明文;曾雪强-.面向规范性文件的基于BERT的文本纠错模型)[J].山西大学学报(自然科学版),2022(02):257-263
A类:
混淆集,中文文本纠错,Pycorrector
B类:
BERT,行政规范性文件,Bidirectional,Encoder,Representations,from,Trans,formers,错字,四类,检错,查出,有错,掩码语言模型,BiLSTM,条件随机场
AB值:
0.229814
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。