典型文献
基于深度学习的中医古籍缺失文本修复研究
文献摘要:
目的:基于构建的高质量中医古籍文本语料库及深度学习语言模型,训练出可以应用于中医古籍缺失文本修复的模型,为中医古籍修复工作提供帮助.方法:分别训练和测试N-gram模型、LSTM模型、BiLSTM模型、RoBERTa模型,对比筛选出最优模型,并将筛选出的最优模型运用到文本修复场景中.结果:BiLSTM模型优于LSTM模型,LSTM模型明显优于N-gram模型,而RoBERTa模型效果最优,将RoBERTa模型运用到《黄帝内经》的修复中,达到了63.36%的hit@1,82.57%的hit@5.结论:将深度学习技术应用于中医古籍缺失文本修复中具有较好的效果,能够为中医古籍修复提供帮助.
文献关键词:
中医古籍;语言模型;文本修复;深度学习;RoBERTa
中图分类号:
作者姓名:
盛威;卢彦杰;刘伟;胡为;周冲
作者机构:
湖南中医药大学信息科学与工程学院,湖南 长沙 410208
文献出处:
引用格式:
[1]盛威;卢彦杰;刘伟;胡为;周冲-.基于深度学习的中医古籍缺失文本修复研究)[J].中华医学图书情报杂志,2022(08):1-7
A类:
文本修复
B类:
中医古籍,语料库,习语,语言模型,练出,古籍修复,gram,BiLSTM,RoBERTa,最优模型,黄帝内经,hit,深度学习技术
AB值:
0.207647
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。