典型文献
融入词集合信息的跨境民族文化实体识别方法
文献摘要:
跨境民族文化领域实体通常由描述民族文化特征的领域词汇组合构成,使用当前主流的基于字符表征的实体识别方法会面临领域实体边界模糊问题,造成实体识别错误.为此,该文提出一种融入词集合信息的跨境民族文化实体识别方法,利用领域词典获取的词集合增强领域实体的词边界和词语义信息.首先,构建跨境民族文化领域词典,用于获取词集合信息;其次,通过词集合注意力机制获取词集合向量之间的权重,并融入位置编码增强词集合位置信息;最后,在特征提取层融入词集合信息,增强领域实体边界信息并缓解仅使用字符特征表示所带来的词语义缺失问题.实验结果表明,在跨境民族文化文本数据集上所提出方法相比于基线方法的F1 值提升了
文献关键词:
跨境民族文化;实体识别;词集合信息;领域词典;注意力机制
中图分类号:
作者姓名:
杨振平;毛存礼;雷雄丽;高盛祥;陆杉;张勇丙
作者机构:
昆明理工大学 信息工程与自动化学院,云南 昆明 650500;昆明理工大学 云南省人工智能重点实验室,云南 昆明 650500;昆明冶金高等专科学校,云南 昆明 650500
文献出处:
引用格式:
[1]杨振平;毛存礼;雷雄丽;高盛祥;陆杉;张勇丙-.融入词集合信息的跨境民族文化实体识别方法)[J].中文信息学报,2022(10):88-96
A类:
词集合信息
B类:
跨境民族文化,实体识别方法,文化特征,字符,法会,会面,边界模糊,领域词典,词边界,词语,语义信息,取词,注意力机制,位置编码,位置信息,用字,特征表示,语义缺失,文化文本,文本数据
AB值:
0.190511
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。