首站-论文投稿智能助手
典型文献
基于领域情感词典与字词特征融合的中文抑郁症文本分类方法
文献摘要:
针对用户的中文评论文本在抑郁倾向上的准确分类问题,提出一种基于领域情感词典与字词特征融合的中文抑郁症文本分类方法.首先基于通用域词典和词语相似度计算,构建并扩展了中文抑郁症领域情感词典;其次,针对中文字词的不同特点,融合了中文的字级特征和词级特征,提高了字词的表征能力;最后将该方法应用于BERT模型,构建了处理中文抑郁症文本分类任务的BERT-W模型.实验结果显示,相比基于浅层神经网络的表示模型,BERT-W模型在CDSD数据集上的精确率、召回率和F1值各项评价指标的表现更好;相比基于字或全领域词的BERT-char模型和BERT-word模型,融合字级特征和情感词特征的BERT-W模型的表征能力更强,精确率达到了 97.59%,F1值达到了 96.11%,在对用户的中文评论文本抑郁倾向分类任务上具有更高效的处理能力,有助于后续对抑郁症患者复杂语料的分类研究.
文献关键词:
抑郁症;情感词典;特征融合;BERT;文本分类
作者姓名:
刘豪;卓广平;乔俊福;张光华
作者机构:
太原师范学院计算机系,山西晋中030619;太原工业学院 自动化系,山西太原030008
引用格式:
[1]刘豪;卓广平;乔俊福;张光华-.基于领域情感词典与字词特征融合的中文抑郁症文本分类方法)[J].中北大学学报(自然科学版),2022(06):522-529
A类:
CDSD
B类:
领域情感词典,字词特征,特征融合,文本分类方法,评论文本,抑郁倾向,分类问题,词语相似度,相似度计算,表征能力,BERT,分类任务,比基,浅层神经网络,表示模型,精确率,召回率,全领域,领域词,char,word,处理能力,抑郁症患者,语料,分类研究
AB值:
0.272013
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。