典型文献
结合多注意力和条件变分自编码器的宋词生成模型
文献摘要:
现有的诗词生成方法忽略了风格的重要性.另外,由于宋词大部分词牌词句较多,逐句生成宋词的过程中容易产生上下文缺乏连贯性的现象,在上下文连贯性方面仍存在提升空间.针对这两个问题,在编码解码的文本生成框架基础上,引入自注意力机制的句子表示算法计算多注意力权重矩阵,用于提取词句的多种重要语义特征,让模型更多地关注上文的显著信息来提高上下文连贯性.引入条件变分自编码器(CVAE)将每条宋词数据转化为隐空间中不同风格特征的高维高斯分布,从各自的分布中采样隐变量来控制宋词的风格.由于自构建的宋词语料库缺少完整风格分类标签,使用具有风格标签的宋词微调BERT模型,将其作为风格分类器标注全部的宋词数据.在上述关键技术的基础上实现了宋词生成模型,生成上下文连贯的婉约词以及豪放词.通过与其他4种基准方法进行对比实验,结果表明引入自注意力机制的句子表示算法和条件变分自编码器,在上下文连贯性和风格控制方面有一定的提升.
文献关键词:
条件变分自编码器;宋词风格;宋词生成;Bi-GRU;自注意力机制
中图分类号:
作者姓名:
梁骁;黄文明;姚俊;温雅媛;邓珍荣
作者机构:
桂林电子科技大学计算机与信息安全学院,广西桂林 541004;广西图形图像与智能处理重点实验室,广西桂林 541004;广西壮族自治区高级人民法院,广西南宁 530000;广西师范大学电子工程学院,广西桂林 541004
文献出处:
引用格式:
[1]梁骁;黄文明;姚俊;温雅媛;邓珍荣-.结合多注意力和条件变分自编码器的宋词生成模型)[J].广西科学,2022(02):308-315
A类:
宋词生成,高维高斯分布,风格控制,宋词风格
B类:
多注意力,条件变分自编码器,生成模型,诗词,生成方法,分词,词牌,词句,逐句,上下文,连贯性,提升空间,在编,编码解码,文本生成,框架基础,自注意力机制,句子,算法计算,注意力权重,权重矩阵,取词,语义特征,注上,CVAE,词数,隐空间,风格特征,隐变量,词语,语料库,整风,微调,BERT,分类器,婉约词,豪放词,基准方法,控制方面,Bi,GRU
AB值:
0.265311
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。