首站-论文投稿智能助手
典型文献
面向数字人文的中国古代典籍词性自动标注研究——以SikuBERT预训练模型为例
文献摘要:
在深度学习技术和预训练语言模型不断发展背景下,文章探讨面向数字人文研究需求的古文典籍文本词性自动标注问题.以校验后的高质量《四库全书》全文语料作为训练集,构建Siku?BERT预训练语言模型,在源自多领域的16部古文典籍文本上开展词性自动标注实验.结果表明:SikuBERT预训练语言模型在词性自动标注任务中表现优良,词性标签总体预测准确率达到89.64%.文章还展示了单机版"SIKU-BERT典籍智能处理系统"的词性自动标注功能设计及应用.
文献关键词:
词性;自动标注;数字人文;SikuBERT;预训练技术
作者姓名:
耿云冬;张逸勤;刘欢;王东波
作者机构:
华中农业大学外国语学院;南京大学信息管理学院;南京农业大学信息管理学院
文献出处:
引用格式:
[1]耿云冬;张逸勤;刘欢;王东波-.面向数字人文的中国古代典籍词性自动标注研究——以SikuBERT预训练模型为例)[J].图书馆论坛,2022(06):55-63
A类:
SikuBERT,古文典籍,Siku,SIKU,预训练技术
B类:
数字人文,中国古代典籍,词性,自动标注,预训练模型,深度学习技术,预训练语言模型,人文研究,研究需求,典籍文本,校验,四库全书,语料,训练集,预测准确率,单机版,智能处理系统,功能设计,设计及应用
AB值:
0.221076
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。