典型文献
命名实体识别技术在"数字敦煌"中的应用研究
文献摘要:
命名实体识别是自然语言处理基础任务之一.针对"数字敦煌"项目应用命名实体识别技术存在的实体边界难以确定等问题,通过构建小规模敦煌石窟专有名词数据集,对基于BERT-BiLSTM-CRF的命名实体识别基本方法,和基于Multi-digraph的词汇增强方法进行了实验对比,结果表明基本方法已具备较高的识别准确率,而基于词汇增强的方法对未登录词识别效果提升显著.最后将训练得到的模型应用于"数字敦煌"资源库命名实体识别任务,证明了方法的有效性.
文献关键词:
命名实体识别;BERT;LSTM;词汇增强;数字敦煌
中图分类号:
作者姓名:
巩一璞;王小伟;王济民;王顺仁
作者机构:
敦煌研究院,甘肃 敦煌 736200;国家古代壁画与土遗址保护工程技术研究中心,甘肃 敦煌 736200;古代壁画保护国家文物局重点科研基地,甘肃 敦煌 736200;甘肃省敦煌文物保护研究中心,甘肃 敦煌 736200;洛桑联邦理工学院,瑞士 洛桑 CH-1015
文献出处:
引用格式:
[1]巩一璞;王小伟;王济民;王顺仁-.命名实体识别技术在"数字敦煌"中的应用研究)[J].敦煌研究,2022(02):149-158
A类:
B类:
命名实体识别,数字敦煌,自然语言处理,项目应用,技术存在,难以确定,小规模,敦煌石窟,专有名词,词数,BERT,BiLSTM,CRF,基本方法,Multi,digraph,词汇增强,增强方法,实验对比,识别准确率,未登录词,效果提升,练得,模型应用,资源库
AB值:
0.292059
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。