典型文献
基于RoBerta-BiLstm-Attention模型的机器生成新闻检测
文献摘要:
随着文本生成算法的快速发展,生成语句通顺、逻辑性强的新闻已经成为可能.但是人类检测机器生成新闻的能力是有限的,因此本文提出了RoBerta-BiLstm-Attention的检测框架,以实现机器生成新闻的自动检测.首先使用RoBerta的词嵌入表示新闻文本,RoBerta能很好的捕捉新闻的语义信息,提高词嵌入关联上下文的质量.然后将新闻的嵌入表示输入到BiLstm-Attention神经网络中.通过微调GPT2构建的机器生成新闻数据集进行了实验测试.实验表明本文提出的方法在检测解码策略是核采样和序列长度为125的机器生成新闻时,相比于目前最好的方法F1值和准确率都提升了近2%,召回率提升了5.56%.在检测解码策略是topK和序列长度为125的机器生成新闻时,无论是准确率和F1值都比目前最好的方法提高了4%左右.
文献关键词:
文本生成;机器生成;假新闻;检测框架
中图分类号:
作者姓名:
徐宇;杨频
作者机构:
四川大学网络空间安全学院,成都 610065
文献出处:
引用格式:
[1]徐宇;杨频-.基于RoBerta-BiLstm-Attention模型的机器生成新闻检测)[J].现代计算机,2022(03):31-35,81
A类:
BiLstm,topK
B类:
RoBerta,Attention,机器生成,文本生成,生成算法,成语,语句,通顺,逻辑性,检测机,检测框架,自动检测,词嵌入表示,新闻文本,语义信息,入关,上下文,微调,GPT2,新闻数据,实验测试,解码,召回率,比目,假新闻
AB值:
0.306656
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。