基于高困惑样本对比学习的隐式篇章关系识别|李晓;洪宇;窦祖俊;徐旻涵;陆煜翔;周国栋 - 期刊导航|首站-论文投稿智能助手|论文发表|论文智能投稿|期刊自助发表推荐|杂志社快速发表|查同导刊-域田数据官方网站

典型文献

基于高困惑样本对比学习的隐式篇章关系识别

文献摘要：

隐式篇章关系识别是一种自动判别论元语义关系的自然语言处理任务.该任务蕴含的关键科学问题涉及两个方面:其一是准确表征论元语义;其二是基于语义表示,有效地判别论元之间的关系类型.该文将集中在第一个方面开展研究.精准可靠的语义编码有助于关系分类,其根本原因是,编码表示的可靠性促进了正负例样本的可区分性(正例样本特指一对蕴含了"目标关系类"的论元,负例则是一对持有"非目标关系类"的论元).近期研究显示,集成对比学习机制的语义编码方法能够提升模型在正负例样本上的可辨识性.为此,该文将对比学习机制引入论元语义的表示学习过程,利用"对比损失"驱动正负例样本的"相异性",即在语义空间中聚合同类正样本,且驱散异类负样本的能力.特别地,该文提出基于条件自编码器的高困惑度负例生成方法,并利用这类负例增强对比学习数据的迷惑性,提升论元语义编码器的鲁棒性.该文使用篇章关系分析的公开语料集PDTB进行实验,实验结果证明,上述方法相较于未采用对比学习的基线模型,在面向对比(Comparison)、偶然(Contingency)、扩展(Expansion)及时序(Temporal)四种PDTB关系类型的二元分类场景中,分别产生了4.68％、4.63％、3.14％、12.77％的F1值性能提升.

文献关键词：

隐式篇章关系识别;对比学习;条件变分编码

中图分类号：

[1] 自动化技术、计算机技术（TP） / 计算技术、计算机技术（TP3） / 计算机软件（TP31） / 程序设计、软件工程（TP311）

[2] 自动化技术、计算机技术（TP） / 计算技术、计算机技术（TP3） / 计算机的应用（TP39） / 计算机网络（TP393）

[3] 自动化技术、计算机技术（TP） / 计算技术、计算机技术（TP3） / 计算机的应用（TP39） / 信息处理(信息加工)（TP391）

作者姓名：

李晓;洪宇;窦祖俊;徐旻涵;陆煜翔;周国栋

作者机构：

苏州大学计算机科学与技术学院,江苏苏州 215006

文献出处：

中文信息学报

引用格式：

[1]李晓;洪宇;窦祖俊;徐旻涵;陆煜翔;周国栋-.基于高困惑样本对比学习的隐式篇章关系识别)[J].中文信息学报,2022(11):38-49

A类：

隐式篇章关系,隐式篇章关系识别,PDTB,Contingency,条件变分编码

B类：

对比学习,别论,论元,语义关系,自然语言处理,关键科学问题,关系类型,语义编码,关系分类,编码表示,正负,可区分性,正例,特指,学习机制,编码方法,可辨识性,表示学习,学习过程,对比损失,相异性,语义空间,驱散,异类,自编码器,生成方法,学习数据,迷惑性,关系分析,语料,基线模型,Comparison,偶然,Expansion,Temporal,二元分类,性能提升

AB值：

0.277282

相似文献

基于全局与局部特征对比的点云自监督学习

刘耿欣;胡瑞珍-深圳大学可视计算研究中心深圳 518061

有限样本条件下欠规范手语识别容错特征扩充

孔乐毅;张金艺;楼亮亮-特种光纤与光接入网重点实验室(上海大学)上海 200444;特种光纤与先进通信国际合作联合实验室(上海大学)上海 200444;中国科学院上海微系统与信息技术研究所无线传感网与通信重点实验室上海 200050

面向小样本情感分类任务的弱监督对比学习框架

卢绍帅;陈龙;卢光跃;管子玉;谢飞-西安邮电大学通信与信息工程学院西安 710121;西安电子科技大学计算机科学与技术学院西安 710071;西安电子科技大学前沿交叉研究院西安 710071

基于语义伪标签和双重特征存储库的无监督跨模态行人重识别

孙锐;余益衡;张磊;张旭东-合肥工业大学计算机与信息学院合肥230601;合肥工业大学工业安全与应急技术安徽省重点实验室合肥230009

基于伪孪生网络双层优化的对比学习