首站-论文投稿智能助手
典型文献
中文开放域问答系统数据增广研究
文献摘要:
开放域问答是自然语言处理中的重要任务之一.目前的开放域问答模型总是倾向于在问题和文章之间做浅层的文本匹配,经常在一些简单问题上出错.这些错误的原因部分是由于阅读理解数据集缺少一些真实场景下常见的模式.该文提出了几种能够提高开放域问答鲁棒性的数据增广方法,能有效减少这些常见模式的影响.此外,我们还构造并公开发布了一个新的开放域问答数据集,能够评估模型在真实场景下的实际效果.实验结果表明我们提出的方法在实际场景下带来了性能提升.
文献关键词:
开放域问答;鲁棒性;数据增广
作者姓名:
杜家驹;叶德铭;孙茂松
作者机构:
清华大学 计算机科学与技术系,北京 100084;清华大学 人工智能研究院,北京 100084;清华大学 智能技术与系统国家重点实验室,北京 100084
文献出处:
引用格式:
[1]杜家驹;叶德铭;孙茂松-.中文开放域问答系统数据增广研究)[J].中文信息学报,2022(11):121-130
A类:
开放域问答
B类:
问答系统,系统数据,数据增广,自然语言处理,文本匹配,出错,阅读理解,解数,真实场景,问答数据集,实际效果,性能提升
AB值:
0.236086
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。