典型文献
基于无监督集成聚类的开放关系抽取方法
文献摘要:
开放关系抽取(Open Relation Extraction,OpenRE)旨在从开放域语料库中抽取关系事实.大多数OpenRE方法通常局限于无监督方法提取命名实体之间的关系模式,然后将语义等价的模式聚类成一个关系簇,但由于缺少监督信息且聚类精度较低,影响了最终的关系抽取效果.为了进一步提高聚类性能,该文提出一种无监督集成聚类框架(Unsupervised Ensemble Clustering,UEC),它将无监督集成学习与基于信息度量的多步聚类算法相结合自主创建高质量伪标签,并以此作为监督信息改进关系特征的学习,从而引导聚类过程,获得更好的标签质量,最后通过多次迭代聚类发现文本中的关系类型.在FewRel和NYT-FB数据集上的实验结果表明,该文方法优于其他主流的基线OpenRE模型,F1值分别达到了65.2%和67.1%.
文献关键词:
开放关系抽取;集成聚类;伪标签
中图分类号:
作者姓名:
谢斌红;李玉;赵红燕
作者机构:
太原科技大学 计算机科学与技术学院,山西 太原 030024
文献出处:
引用格式:
[1]谢斌红;李玉;赵红燕-.基于无监督集成聚类的开放关系抽取方法)[J].中文信息学报,2022(05):49-58
A类:
开放关系抽取,OpenRE,FewRel
B类:
集成聚类,Relation,Extraction,语料库,无监督方法,命名实体,关系模式,等价,监督信息,聚类精度,Unsupervised,Ensemble,Clustering,UEC,集成学习,信息度,多步,聚类算法,自主创建,伪标签,进关,关系特征,标签质量,多次迭代,迭代聚类,关系类型,NYT,FB
AB值:
0.404468
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。