典型文献
融合多策略数据增强的低资源依存句法分析方法
文献摘要:
依存句法分析旨在识别句子中词与词之间的句法依赖关系.依存句法能为信息抽取、自动问答和机器翻译等任务提供句法特征,提高模型性能.训练数据规模对依存句法分析模型的性能具有重要影响,训练数据的缺乏会带来严重的未知词问题和模型过拟合问题.文中针对低资源依存句法分析问题,提出了多种数据增强策略.所提方法通过同义词替换有效扩充了训练数据,缓解了未知词问题.通过多种Mixup的数据增强策略,有效缓解了模型过拟合问题,提高了模型的泛化能力.在(Universal Dependencies treebanks,UD treebanks)数据集上的实验结果表明,所提方法有效提升了小规模训练语料条件下泰语、越南语和英语依存句法分析的性能.
文献关键词:
依存句法分析;低资源语言;Mixup数据增强;同义词替换;多策略
中图分类号:
作者姓名:
线岩团;高凡雅;相艳;余正涛;王剑
作者机构:
昆明理工大学信息工程与自动化学院 昆明 650500;昆明理工大学云南省人工智能重点实验室 昆明 650500
文献出处:
引用格式:
[1]线岩团;高凡雅;相艳;余正涛;王剑-.融合多策略数据增强的低资源依存句法分析方法)[J].计算机科学,2022(01):73-79
A类:
Dependencies,treebanks
B类:
多策略,依存句法分析,别句,句子,中词,句法依赖,依赖关系,信息抽取,自动问答,机器翻译,句法特征,模型性能,训练数据,过拟合,分析问题,数据增强策略,同义词替换,换有,Mixup,泛化能力,Universal,UD,小规模,语料,泰语,越南语,低资源语言
AB值:
0.284615
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。