典型文献
基于深度学习的生成式蒙古文问答模型研究
文献摘要:
针对蒙古文问答系统研究较少,缺乏公开可用的蒙古文问答语料等问题,本文通过对现有中文问答语料进行收集、筛选、翻译、人工校正,构建了10万对蒙古文问答语料库.在此基础上,分别实现了基于循环神经网络和基于Transformer的蒙古文问答模型,对于因蒙古文自身的复杂性和训练语料较少而导致模型无法正确理解输入序列的问题,使用不同词切分方法对蒙古文问答语料进行了切分.实验结果表明,网络单元选择双向GRU并引入Attention机制的循环神经网络蒙古文问答模型效果最佳.相比循环神经网络模型,基于Transformer的蒙古文问答模型在困惑度指标上提高了37.71%~38.51%,回复的多样性也有了一定的提升.在几种切分方法对比中,基于Unigram词切分的Transformer模型在处理含有蒙古文构词结构复杂的句子时,效果最佳,生成的句子更完整.
文献关键词:
蒙古文问答模型;生成式;词切分
中图分类号:
作者姓名:
特日格勒呼;王斯日古楞
作者机构:
内蒙古师范大学 计算机科学技术学院,内蒙古 呼和浩特010022
文献出处:
引用格式:
[1]特日格勒呼;王斯日古楞-.基于深度学习的生成式蒙古文问答模型研究)[J].中央民族大学学报(自然科学版),2022(03):32-41
A类:
蒙古文问答模型,Unigram
B类:
生成式,问答系统,问答语料,万对,语料库,Transformer,正确理解,词切分,网络单元,GRU,Attention,循环神经网络模型,回复,方法对比,构词,句子
AB值:
0.165317
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。