典型文献
面向中文医疗问答网站的相似问题检索研究
文献摘要:
医疗问答平台主要通过关键词检索来服务,但其缺点是难以应对文本中多样化表达、否定词较多等特点,且不能充分根据用户的语义查询,使查询结果中有大量无关项.因此该文先用基于改进文本卷积神经网络的哈希生成模型,进行相似问题的语义检出,以更好地处理文本中的多样化表达、否定词较多等现象.然后,用更精确的文本匹配模型对检出集合进行过滤和排序,通过集成学习构建该模型.模型先集成Siamese-BERT模型,该模型利用孪生网络,并用BERT作为基础模型,能更好地进行语义抽取;接着集成BERT-Match模型,该模型借助BERT的多头注意力机制,能更好地捕捉问句间的局部相关性.最后,用梯度下降提升树将语义特征及统计特征结合,使模型更准确.实验结果表明,该文方法在进行相似问题检出和文本匹配时能得到更好的结果.
文献关键词:
医疗问答平台;文本卷积神经网络;文本匹配模型;集成学习
中图分类号:
作者姓名:
王保成;刘利军;黄青松
作者机构:
昆明理工大学 信息工程与自动化学院,云南 昆明650500;云南省计算机技术应用重点实验室,云南 昆明650500
文献出处:
引用格式:
[1]王保成;刘利军;黄青松-.面向中文医疗问答网站的相似问题检索研究)[J].中文信息学报,2022(06):135-145
A类:
医疗问答平台
B类:
过关,关键词检索,多样化表达,否定词,语义查询,先用,文本卷积神经网络,哈希,生成模型,文本匹配模型,行过滤,集成学习,Siamese,BERT,孪生网络,基础模型,语义抽取,Match,多头注意力机制,问句,局部相关,梯度下降,提升树,语义特征,统计特征,特征结合
AB值:
0.331802
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。