典型文献
基于高困惑样本对比学习的隐式篇章关系识别
文献摘要:
隐式篇章关系识别是一种自动判别论元语义关系的自然语言处理任务.该任务蕴含的关键科学问题涉及两个方面:其一是准确表征论元语义;其二是基于语义表示,有效地判别论元之间的关系类型.该文将集中在第一个方面开展研究.精准可靠的语义编码有助于关系分类,其根本原因是,编码表示的可靠性促进了正负例样本的可区分性(正例样本特指一对蕴含了"目标关系类"的论元,负例则是一对持有"非目标关系类"的论元).近期研究显示,集成对比学习机制的语义编码方法能够提升模型在正负例样本上的可辨识性.为此,该文将对比学习机制引入论元语义的表示学习过程,利用"对比损失"驱动正负例样本的"相异性",即在语义空间中聚合同类正样本,且驱散异类负样本的能力.特别地,该文提出基于条件自编码器的高困惑度负例生成方法,并利用这类负例增强对比学习数据的迷惑性,提升论元语义编码器的鲁棒性.该文使用篇章关系分析的公开语料集PDTB进行实验,实验结果证明,上述方法相较于未采用对比学习的基线模型,在面向对比(Comparison)、偶然(Contingency)、扩展(Expansion)及时序(Temporal)四种PDTB关系类型的二元分类场景中,分别产生了4.68%、4.63%、3.14%、12.77%的F1值性能提升.
文献关键词:
隐式篇章关系识别;对比学习;条件变分编码
中图分类号:
作者姓名:
李晓;洪宇;窦祖俊;徐旻涵;陆煜翔;周国栋
作者机构:
苏州大学 计算机科学与技术学院,江苏 苏州 215006
文献出处:
引用格式:
[1]李晓;洪宇;窦祖俊;徐旻涵;陆煜翔;周国栋-.基于高困惑样本对比学习的隐式篇章关系识别)[J].中文信息学报,2022(11):38-49
A类:
隐式篇章关系,隐式篇章关系识别,PDTB,Contingency,条件变分编码
B类:
对比学习,别论,论元,语义关系,自然语言处理,关键科学问题,关系类型,语义编码,关系分类,编码表示,正负,可区分性,正例,特指,学习机制,编码方法,可辨识性,表示学习,学习过程,对比损失,相异性,语义空间,驱散,异类,自编码器,生成方法,学习数据,迷惑性,关系分析,语料,基线模型,Comparison,偶然,Expansion,Temporal,二元分类,性能提升
AB值:
0.277282
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。