典型文献
融合音节部件特征的藏文命名实体识别方法
文献摘要:
藏文命名实体识别是藏语自然语言处理的基础任务,是完成机器翻译、网络舆情检测和知识图谱构建等任务的前提.传统的基于深度学习的藏文命名实体识别将藏文音节(字嵌入)作为模型输入的方法容易忽略藏文音节的局部特征.针对这一问题,本文提出了一种融合构成藏文音节部件特征和藏文音节特征的藏文命名实体识别神经网络模型SL-BiLSTM-CRF(syllable level long short-term memory conditional random field).其中,SL模块对构成音节的部件信息和藏文的单个音节进行特征编码,将两种不同模态的特征融合之后送入BiLSTM模型进行特征提取并预测实体标签,再通过CRF对BiLSTM模型的预测结果进行矫正,最终输出藏文实体识别结果.实验证明,该方法在藏文命名实体识别任务中相比基于单个藏文音节(字嵌入)的BiLSTM-CRF模型的F1值提高了1.58个百分点,验证了该方法在藏文命名实体识别任务中的有效性.
文献关键词:
音节部件特征;藏文命名实体识别;深度学习
中图分类号:
作者姓名:
洛桑嘎登;群诺;索南尖措;仁增多杰
作者机构:
西藏大学信息科学技术学院,西藏 拉萨 850000
文献出处:
引用格式:
[1]洛桑嘎登;群诺;索南尖措;仁增多杰-.融合音节部件特征的藏文命名实体识别方法)[J].厦门大学学报(自然科学版),2022(04):624-629
A类:
音节部件特征,藏文命名实体识别,syllable
B类:
合音,实体识别方法,藏语,自然语言处理,机器翻译,网络舆情,舆情检测,知识图谱构建,字嵌入,模型输入,局部特征,成藏,SL,BiLSTM,CRF,level,long,short,term,memory,conditional,random,field,特征编码,特征融合,后送,送入,比基,百分点
AB值:
0.185946
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。