首站-论文投稿智能助手
典型文献
多特征融合的越南语关键词生成方法
文献摘要:
越南语属于低资源语种,高质量关键词新闻数据稀缺,为了解决样本不足条件下生成越南语新闻关键词准确性不高的问题,提出了一种多特征融合的越南语关键词生成模型,拟提升生成的越南语关键词与越南语新闻文档的相关性.首先,将越南语新闻实体、词性、词汇位置特征与词向量拼接,使输入模型的词向量包含更多维度的语义信息;其次,利用双向注意力机制捕获上下文与新闻标题的依赖关系,增强标题在关键词生成中的指导作用;最后,结合复制机制生成越南语关键词,从而提高关键词的语义相关性.在构建的越南语新闻关键词数据集上进行实验,结果表明融合多特征的关键词生成模型能在越南语训练样本有限的条件下生成高质量关键词,F1@10、R@50分数比TG-Net分别提升了13.2%和17.1%.
文献关键词:
多特征;越南语;关键词生成;双向注意力机制;词向量
作者姓名:
陈瑞清;高盛祥;余正涛;张迎晨;张磊;杨舰
作者机构:
昆明理工大学 信息工程与自动化学院,云南 昆明 650500;昆明理工大学 云南省人工智能重点实验室,云南 昆明 650500
引用格式:
[1]陈瑞清;高盛祥;余正涛;张迎晨;张磊;杨舰-.多特征融合的越南语关键词生成方法)[J].云南大学学报(自然科学版),2022(01):23-33
A类:
B类:
多特征融合,越南语,关键词生成,生成方法,低资源,源语,语种,质量关,新闻数据,稀缺,生成模型,拟提,文档,词性,位置特征,词向量,向量拼接,语义信息,双向注意力机制,上下文,新闻标题,依赖关系,复制机制,语义相关性,词数,训练样本,本有,Net
AB值:
0.297627
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。