首站-论文投稿智能助手
典型文献
基于Bi-LSTM的医学文本分词模型
文献摘要:
中文分词(Chinese Word Segmentation,CWS)是自然语言处理(Natural Language Processing,NLP)中一项重要的基础任务.由于不同领域中文词汇的特殊性以及缺乏相关领域的标记数据,面向特定领域的分词任务是近年来中文分词研究面临的挑战之一.因此,提出了一种基于双向长短时记忆网络(Bidirectional Long Short-Term Memory,Bi-LSTM)的分词模型,其中分别使用了大规模的中文通用语料以及少量中文医学语料训练模型来构建这种全新的分词模型.该模型在仅使用少量中文医学领域标记数据的情况下,在该领域的分词任务上获得了较好的分词效果,实验结果中的最优F1值为95.54%,相比单独使用中文医学语料训练的分词模型,有比较明显的提升.
文献关键词:
中文分词;自然语言处理;双向长短期记忆网络;领域分词
作者姓名:
邵党国;黄初升;马磊;贺建峰;易三莉
作者机构:
昆明理工大学 信息工程与自动化学院,云南 昆明 650500
文献出处:
引用格式:
[1]邵党国;黄初升;马磊;贺建峰;易三莉-.基于Bi-LSTM的医学文本分词模型)[J].通信技术,2022(02):151-159
A类:
B类:
医学文本,文本分词,中文分词,Chinese,Word,Segmentation,CWS,自然语言处理,Natural,Language,Processing,NLP,文词,记数,特定领域,双向长短时记忆网络,Bidirectional,Long,Short,Term,Memory,通用语,语料,训练模型,医学领域,双向长短期记忆网络,领域分词
AB值:
0.387536
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。