首站-论文投稿智能助手
典型文献
《黄帝内经》文本语料库的构建与应用研究
文献摘要:
针对当前优质中医古籍语料库较为缺乏的问题,对《黄帝内经》全书156,507字进行人工标注,构建集词性标注和分词一体的《黄帝内经》中医古籍语料库,并对《黄帝内经》开展系统性的中文分词研究.基于本文语料库,采用CRF、HMM、BiLSTM-CRF、BERT-BiLSTM-CRF、RoBERTa-wwm-BiLSTM-CRF等算法开展中文分词研究.经过对比验证得出RoBERTa-wwm-BiLSTM-CRF算法分词效果在各方面均有较大提升,准确率、召回率和F1值分别为93.86%、94.41%、94.13%,明显优于传统机器学习和主流深度学习方法.
文献关键词:
语料库;中医古籍;中文分词;黄帝内经;深度学习
作者姓名:
石玉敬;刘伟;葛晓舒;胡为;刘弋莲;易洋
作者机构:
湖南中医药大学信息科学与工程学院,湖南 长沙 410208;湖南中医药大学中医学院
文献出处:
引用格式:
[1]石玉敬;刘伟;葛晓舒;胡为;刘弋莲;易洋-.《黄帝内经》文本语料库的构建与应用研究)[J].计算机时代,2022(12):1-3,8
A类:
B类:
黄帝内经,语料库,构建与应用,中医古籍,词性标注,中文分词,CRF,HMM,BiLSTM,RoBERTa,wwm,对比验证,召回率,深度学习方法
AB值:
0.222943
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。