典型文献
融合知识感知与双重注意力的短文本分类模型
文献摘要:
文本分类任务作为文本挖掘的核心问题,已成为自然语言处理领域的一个重要课题.而短文本分类由于稀疏性、实时性和不规范性等特点,已成为文本分类亟待解决的问题之一.在某些特定场景,短文本存在大量隐含语义,由此给挖掘有限文本内的隐含语义特征等任务带来挑战.已有的方法对短文本分类主要采用传统机器学习或深度学习算法,但该类算法的模型构建复杂且工作量大,效率不高.此外,短文本包含有效信息较少且口语化严重,对模型的特征学习能力要求较高.针对以上问题,提出了 KAeRCNN模型,该模型在TextRCNN模型的基础上,融合了知识感知与双重注意力机制.知识感知包含了知识图谱实体链接和知识图谱嵌入,可以引入外部知识以获取语义特征,同时,双重注意力机制可以提高模型对短文本中有效信息提取的效率.实验结果表明,KAeRCNN模型在分类准确度、F1值和实际应用效果等方面显著优于传统的机器学习算法.对算法的性能和适应性进行了验证,准确率达到95.54%,F1值达到0.901,对比4种传统机器学习算法,准确率平均提高了约14%,F1值提升了约13%.与TextRCNN相比,KAeRCNN模型在准确性方面提升了约3%.此外,与深度学习算法的对比实验结果也说明,该模型在其他领域的短文本分类中也有较好的表现.理论和实验结果都证明,所提出的KAeRCNN模型对短文本分类效果更优.
文献关键词:
短文本分类;知识图谱;注意力机制;TextRCNN;实体消歧
中图分类号:
作者姓名:
李博涵;向宇轩;封顶;何志超;吴佳骏;戴天伦;李静
作者机构:
南京航空航天大学计算机科学与技术学院/人工智能学院/软件学院,江苏南京211106;高安全系统的软件开发与验证技术工业和信息化部重点实验室(南京航空航天大学),江苏南京211106;软件新技术与产业化协同创新中心,江苏南京211106;南京市公安局,江苏南京211106
文献出处:
引用格式:
[1]李博涵;向宇轩;封顶;何志超;吴佳骏;戴天伦;李静-.融合知识感知与双重注意力的短文本分类模型)[J].软件学报,2022(10):3565-3581
A类:
KAeRCNN
B类:
融合知识,知识感知,短文本分类,分类模型,分类任务,文本挖掘,自然语言处理,稀疏性,在某些特,特定场景,语义特征,深度学习算法,效率不高,有效信息,口语化,特征学习能力,能力要求,TextRCNN,双重注意力机制,实体链接,知识图谱嵌入,外部知识,信息提取,实际应用效果,机器学习算法,分类效果,实体消歧
AB值:
0.211858
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。