典型文献
面向数字人文的稷下思想自动分类研究
文献摘要:
[目的/意义]稷下思想是先秦百家争鸣时期的沧海遗珠,研究如何从稷下研究文献中自动识别出稷下思想,为稷下学数字人文研究提供方法基础.[方法/过程]选取《管子学刊》作为研究数据源,对其收录的部分文本进行11大类附属42小类的思想类别归纳,构建训练数据集,提出一种基于ERNIE微调的JixiaERNIE模型,将稷下思想自动识别映射为文本自动分类问题,利用模型进行自动分类识别.[结果/结论]通过实验对比得出,构建的Jixi-aERNIE模型在学习率4e-5、迭代次数为10分类效果达到最优,与基线模型相比,F值提高了 7.9%.为进一步增强模型识别分类效果,在模型连接层的基础上加入分类器对比,有效实现面向数字人文研究的稷下思想自动分类任务.
文献关键词:
数字人文;自动分类;管子学刊;稷下思想;JixiaERNIE
中图分类号:
作者姓名:
冯梦莹;白如江;张玉洁;王效岳;耿振东;王志民
作者机构:
山东理工大学信息管理研究院 淄博255049;山东理工大学齐文化研究院 淄博255049
文献出处:
引用格式:
[1]冯梦莹;白如江;张玉洁;王效岳;耿振东;王志民-.面向数字人文的稷下思想自动分类研究)[J].图书情报工作,2022(19):26-35
A类:
稷下思想,管子学刊,JixiaERNIE,Jixi,aERNIE
B类:
数字人文,分类研究,先秦,百家争鸣,沧海遗珠,自动识别,稷下学,人文研究,方法基础,研究数据,数据源,分文,训练数据集,微调,文本自动分类,分类问题,分类识别,实验对比,比得,学习率,4e,迭代次数,分类效果,基线模型,增强模型,模型识别,识别分类,分类器,分类任务
AB值:
0.269609
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。