首站-论文投稿智能助手
典型文献
基于机器学习的古籍目录互著与别裁探
文献摘要:
目录是组织与利用古籍资源的重要工具,也是图书情报学科的重点研究对象.互著与别裁作为古典目录学中的两种辅助方法,能在深入剖析文献内容特征的基础上,根据内容的多元性将文献准确、完整地记载于目录体系中,达到"类例既分,学术自明"的效果.将互著与别裁映射为文本挖掘中的文本分类问题,提出基于机器学习以实现互著与别裁的方法框架,为古籍在目录体系中的多类目记载提供方法.首先利用TextCNN与BERT两种机器学习模型对先秦诸子六家十部典籍文本进行分类训练,结果显示BERT优于TextCNN,可以达到91.64%的分类准确率;之后用微调训练后的BERT模型对《荀子》与《管子》进行篇、章粒度的分类判断,最终得出这两部图书各篇章互著与别裁的结果.本研究展现了在数字人文视域下,数字技术对古典目录学、古典文献学以及学术史研究的应用价值.图5.表7.参考文献43.
文献关键词:
古籍目录;互著;别裁;机器学习;数字人文
作者姓名:
张力元;王军
作者机构:
北京大学图书馆 北京100871;北京大学信息管理系 北京100871
文献出处:
引用格式:
[1]张力元;王军-.基于机器学习的古籍目录互著与别裁探)[J].中国图书馆学报,2022(02):47-61
A类:
互著
B类:
基于机器学习,古籍目录,别裁,图书情报学科,古典目录学,内容特征,多元性,整地,地记,载于,目录体系,文本挖掘,文本分类,分类问题,方法框架,类目,TextCNN,BERT,机器学习模型,先秦诸子,六家,十部,典籍文本,分类训练,分类准确率,微调训练,荀子,管子,类判,数字人文,古典文献学,学术史研究,参考文献
AB值:
0.354098
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。