首站-论文投稿智能助手
典型文献
融合词典与对抗迁移的越南语事件实体识别
文献摘要:
针对越南语事件标注语料稀缺且标注语料中未登陆词过多导致实体识别精度降低的问题,提出一种融合词典与对抗迁移的实体识别模型.将越南语作为目标语言,英语和汉语作为源语言,通过源语言的实体标注信息和双语词典提升目标语言的实体识别效果.采用词级别对抗迁移实现源语言与目标语言的语义空间共享,融合双语词典进行多粒度特征嵌入以丰富目标语言词的语义表征,再使用句子级别对抗迁移提取与语言无关的序列特征,最终通过条件随机场推理模块标注实体识别结果.在越南语新闻数据集上的实验结果表明,在源语言为英语和汉语的情况下,该模型相比主流的单语实体识别模型和迁移学习模型的实体识别性能有明显提升,并且在加入目标语义标注数据后,相比单语实体识别模型的F1值分别增加了19.61和18.73个百分点.
文献关键词:
实体识别;对抗迁移;双语词典;多粒度特征;序列特征
作者姓名:
薛振宇;线岩团;余正涛;高盛祥;普浏清
作者机构:
昆明理工大学 信息工程与自动化学院,昆明 650500;昆明理工大学 云南省人工智能重点实验室,昆明 650500
文献出处:
引用格式:
[1]薛振宇;线岩团;余正涛;高盛祥;普浏清-.融合词典与对抗迁移的越南语事件实体识别)[J].计算机工程,2022(03):107-114,145
A类:
未登陆
B类:
对抗迁移,越南语,实体识别,语料,稀缺,识别精度,识别模型,目标语言,源语言,实体标注,标注信息,双语词典,提升目标,用词,语义空间,空间共享,多粒度特征,特征嵌入,言词,语义表征,句子级,序列特征,条件随机场,新闻数据,单语,迁移学习,识别性,目标语义,语义标注,百分点
AB值:
0.253397
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。