FAILED
首站-论文投稿智能助手
典型文献
基于BERT+BiLSTM+CRF模型与新预处理方法的古籍自动标点
文献摘要:
古文相较于现代文不仅在用词、语法等方面存在巨大差异,还缺少标点,使人难以理解语义.采用人工方式对古文进行标点既需要有较高的文学水平,还需要对历史文化有一定了解.为提高古文自动标点的准确率,将深层语言模型BERT与双向长短记忆网络和条件随机场模型(BiLSTM+CRF)相结合建立新模型,并提出新的数据预处理方法.该模型在古文自动标点上的各项性能指标均能达到85%左右,比常用方法提高了8%左右.同时,该模型也表现出较好的泛化性能,即使在从未训练和预测过的古文数据集上各项指标也能达到78%左右.实验结果表明,该模型和新的预处理方法不仅能够更好地学习古文的语义信息和上下文关联信息,还能够学习标签的规范信息.
文献关键词:
古籍;自动标点;BERT模型;条件随机场
作者姓名:
王瑶;顾磊
作者机构:
南京邮电大学计算机学院软件学院网络空间安全学院,江苏南京210023
文献出处:
引用格式:
[1]王瑶;顾磊-.基于BERT+BiLSTM+CRF模型与新预处理方法的古籍自动标点)[J].软件导刊,2022(09):7-13
A类:
BERT+BiLSTM+CRF
B类:
古籍,自动标点,古文,现代文,用词,语法,解语,高古,语言模型,双向长短记忆网络,条件随机场,数据预处理方法,常用方法,泛化性能,从未,地学,语义信息,上下文,联信,够学,学习标签
AB值:
0.296917
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。