首站-论文投稿智能助手
典型文献
基于多算法融合的文本抄袭检测的特征提取算法研究
文献摘要:
特征提取是文本抄袭检测的重要环节,文本特征提取结果的质量将直接影响检测的可靠性.针对现有方法的不足,提出一种基于多算法融合的文本特征提取算法.该方法考虑到文本写作主题和写作风格对文本特征提取结果的影响,通过LDA主题模型、同义词林和GloVe&TF-IDF分别提取文本写作风格和文本主题的3个分特征向量,利用变分自编码器(VAE)进行混合和降维,提取出能够高度代表文本的融合特征向量.实验结果表明,该文本特征提取算法能够准确选择文本的特征集,解决了传统特征提取算法未考虑到文本写作风格和文本主题的缺点,检测的精确率达到了97.93%,相较于其他算法有所提高.
文献关键词:
特征提取;抄袭检测;多算法融合;写作风格;文本主题
作者姓名:
陈滔;张庆国;何金波;周文竹
作者机构:
安徽农业大学 工学院,合肥230036;甘肃政法大学 民商经济法学院,兰州720070;安徽医科大学 临床医学院,合肥230031;安徽农业大学 资源与环境学院,合肥230036
引用格式:
[1]陈滔;张庆国;何金波;周文竹-.基于多算法融合的文本抄袭检测的特征提取算法研究)[J].湖北民族大学学报(自然科学版),2022(01):67-72
A类:
B类:
多算法融合,抄袭检测,特征提取算法,算法研究,文本特征提取,法考,写作主题,写作风格,LDA,主题模型,同义词,词林,GloVe,TF,IDF,文本主题,分特征,特征向量,变分自编码器,VAE,表文,融合特征,征集,传统特征,精确率
AB值:
0.282577
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。