典型文献
基于变分自编码器的谣言立场分类算法
文献摘要:
针对当前谣言检测任务中社交媒体推特平台的推文数据分布复杂且不均衡的特点,提出基于变分自编码器(VAE)的谣言立场分类算法VAE-LSTM.对数据进行预处理后,利用word2vec模型提取推文词向量并输入VAE中进行训练,得到符合简单概率分布的深度特征序列再从中采样获取有效特征,以避免数据量较大的推文类别影响特征向量.在此基础上,使用长短时记忆(LSTM)网络处理向量序列数据进而实现分类.理论分析和实验结果表明,VAE-LSTM算法无须手动提取或添加特征,训练过程简单高效,同时能缓解类间不平衡问题,其应用于实际场景准确率和F1得分分别为0.800和0.494,与时序注意力机制算法、Turing算法、霍克斯过程算法等相比分类性能更好,且较SVM等早期机器学习方法节省了大量数据预处理时间.
文献关键词:
变分自编码器;长短时记忆网络;社交网络;谣言立场;深度特征
中图分类号:
作者姓名:
郭奉琦;孟凡荣;王志晓
作者机构:
中国矿业大学 计算机科学与技术学院,江苏 徐州 221116
文献出处:
引用格式:
[1]郭奉琦;孟凡荣;王志晓-.基于变分自编码器的谣言立场分类算法)[J].计算机工程,2022(02):99-105
A类:
谣言立场
B类:
变分自编码器,分类算法,谣言检测,社交媒体,推特,推文,数据分布,VAE,word2vec,文词,词向量,概率分布,深度特征,特征序列,有效特征,数据量,文类,影响特征,特征向量,序列数据,无须,加特,训练过程,不平衡问题,时序注意力机制,Turing,霍克斯过程,分类性能,机器学习方法,数据预处理,处理时间,长短时记忆网络,社交网络
AB值:
0.329223
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。