首站-论文投稿智能助手
典型文献
基于词映射构建伪查询改善低资源跨语言信息检索研究
文献摘要:
拟基于词映射实现跨语言沟通,缓解缺乏查询-文档语料及语言差异给检索带来的影响,提出一种基于双语交互注意力机制的伪查询句融合方法,通过词映射构造伪查询句,并基于双语交互注意力机制获取跨语言特征表示来实现跨语言信息检索(Cross-language information retrieval,CLIR).主要包括以下三个部分:首先基于词映射分别构造伪查询句;其次,基于共享Transformer获取查询、伪查询及文档的上下文表示,同时借助查询与伪查询之间的双语交互注意力机制获得查询的跨语言特征表示;最后利用双语交互排序获得查询和文档的匹配分数实现跨语言信息检索.基于英菲、英斯两种低资源CLIR公共数据集和本文构建的汉越数据集的实验结果表明,本文方法相比跨语言检索基线方法,MAP指标分别提升了 1.5%和5.4%.
文献关键词:
跨语言信息检索;词映射;双语交互注意力;伪查询句
作者姓名:
李岩;郭军军;余正涛;高盛祥
作者机构:
昆明理工大学 信息工程与自动化学院,云南 昆明650504;昆明理工大学云南省人工智能重点实验室,云南昆明650504
引用格式:
[1]李岩;郭军军;余正涛;高盛祥-.基于词映射构建伪查询改善低资源跨语言信息检索研究)[J].山西大学学报(自然科学版),2022(02):322-331
A类:
双语交互注意力,伪查询句,CLIR
B类:
词映射,低资源,跨语言信息检索,语言沟通,文档,语料,语言差异,交互注意力机制,融合方法,语言特征,特征表示,Cross,language,information,retrieval,Transformer,上下文,配分,英斯,公共数据,跨语言检索,MAP
AB值:
0.198962
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。