典型文献
面向中医古籍文本的领域自适应性无监督分词
文献摘要:
中医古籍文本分词是中医古籍结构化表示及深度挖掘的基础性工作.有监督的中医古籍文本分词简易可行,但存在耗费大量人力物力、专业门槛高、主观性强、扩展性不好等问题.为此改进TextRank算法,提出ConnectRank算法,根据字符连通度实现中医古籍无监督分词.基于《伤寒杂病论》《黄帝内经》《难经》等700篇中医古籍文献语料设计实验.实验结果表明,该模型在中医古籍文本分词中较其他无监督分词模型有更好的分词效果,比传统的无监督分词方法提高了11.2%.
文献关键词:
中医古籍文献;ConnectRank算法;无监督分词;字符连通度;领域自适应性
中图分类号:
作者姓名:
张素华;叶青;程春雷;邹静
作者机构:
江西中医药大学计算机学院,江西南昌330004
文献出处:
引用格式:
[1]张素华;叶青;程春雷;邹静-.面向中医古籍文本的领域自适应性无监督分词)[J].软件导刊,2022(01):96-100
A类:
领域自适应性,无监督分词,ConnectRank,字符连通度
B类:
文本分词,深度挖掘,基础性工作,有监督,耗费,人力物力,槛高,主观性,扩展性,TextRank,伤寒杂病论,黄帝内经,难经,中医古籍文献,文献语料,设计实验
AB值:
0.164128
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。