首站-论文投稿智能助手
典型文献
面向数字人文的先秦两汉典籍自动标点研究——以SikuBERT预训练模型为例
文献摘要:
古籍自动标点研究成为推动古籍研究在人文社科领域发展的关键环节.文章利用Siku?BERT模型,以"中国哲学书电子化计划"古籍数据库中的先秦两汉典籍为数据源,进行自动标点训练,探索基于深度学习技术的古文自动标点模型.实验结果表明:SikuBERT模型对先秦两汉典籍自动标点的整体效果比较优越,对书名号、冒号、句号以及逗号,预测表现良好,尤其是书名号与冒号标签的识别准确率、召回率与F1值均达到95%以上.文章验证了BERT模型在古籍文本自动标点中的可行性.
文献关键词:
数字人文;汉语典籍;自动标点;SikuBERT模型
作者姓名:
赵连振;张逸勤;刘江峰;王东波;冯敏萱;李斌
作者机构:
南京大学外国语学院;南京大学信息管理学院;南京农业大学信息管理学院;南京师范大学文学院
文献出处:
引用格式:
[1]赵连振;张逸勤;刘江峰;王东波;冯敏萱;李斌-.面向数字人文的先秦两汉典籍自动标点研究——以SikuBERT预训练模型为例)[J].图书馆论坛,2022(12):120-128,137
A类:
SikuBERT,Siku
B类:
数字人文,先秦两汉,自动标点,预训练模型,古籍研究,人文社科,中国哲学,电子化,古籍数据库,数据源,深度学习技术,古文,整体效果,效果比较,书名号,冒号,句号,逗号,识别准确率,召回率,点中,汉语典籍
AB值:
0.274647
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。