典型文献
基于三元训练的跨领域依存句法分析
文献摘要:
基于大规模领域内标注数据训练的句法分析模型在领域外数据上测试时,性能会急剧下降.导致该现象的原因之一是缺乏高质量的目标领域标注数据.由于人工标注数据耗时耗力,自动生成目标领域标注数据是一种有效的解决方法.其中,三元训练(tri-training)作为一种典型的多模型决策协同训练方法,旨在利用多个模型的预测结果来保证自动标注数据的质量.本文针对跨领域依存句法分析任务,系统比较了3种常用的tri-training方法,在NLPCC-2019评测数据集上取得了目前最佳的性能,并大幅度超过了目前最好结果.此外,还设计了详细的分析实验以深入理解跨领域模型性能下降的原因以及tri-training所起的作用.
文献关键词:
三元训练;领域适应;依存句法
中图分类号:
作者姓名:
李帅克;李英;李正华;张民
作者机构:
苏州大学计算机科学与技术学院,江苏 苏州 215006
文献出处:
引用格式:
[1]李帅克;李英;李正华;张民-.基于三元训练的跨领域依存句法分析)[J].厦门大学学报(自然科学版),2022(04):638-645,后插1
A类:
三元训练
B类:
跨领域,依存句法分析,内标,数据训练,域外数据,急剧下降,耗力,自动生成,tri,training,多模型,模型决策,协同训练,训练方法,自动标注,NLPCC,评测数据集,领域模型,模型性能,性能下降,领域适应
AB值:
0.357038
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。