首站-论文投稿智能助手
典型文献
差异性案件要素增强的案件舆情时间线生成方法
文献摘要:
案件舆情时间线生成是将同一案件的舆情新闻按照时间顺序生成话题簇,对于用户了解案件的发展过程具有重要意义,本质可以看做一个时间约束下的无监督聚类任务.但是描述同一案件的舆情新闻可能存在许多相同的要素导致其在聚类空间中的表征出现重叠.为了生成更有区分度的文本表征,基于自编码框架,提出一种差异性案件要素增强的案件舆情时间线生成方法.首先构建涉案舆情时间线数据集并生成每条微博文本的差异性要素;然后将差异性要素、微博文本和案件时间作为BERT编码器的输入,基于自编码框架生成文本的低维特征向量;最后基于该特征向量和K-Means聚类的方法,使用软聚类生成案件舆情时间线.实验结果表明,在构造的涉案舆情时间线数据集上,提出的方法在ACC和NMI两个聚类指标上均有较大提升.
文献关键词:
案件舆情时间线;差异性案件要素;自编码;软聚类
作者姓名:
高盛祥;赵瑶;余正涛;黄于欣
作者机构:
昆明理工大学信息工程与自动化学院,昆明650500;昆明理工大学云南省人工智能重点实验室,昆明650500
引用格式:
[1]高盛祥;赵瑶;余正涛;黄于欣-.差异性案件要素增强的案件舆情时间线生成方法)[J].小型微型计算机系统,2022(09):1902-1907
A类:
差异性案件要素,案件舆情时间线
B类:
生成方法,一案,看做,时间约束,无监督聚类,类空,区分度,文本表征,自编码,种差,涉案,微博文本,BERT,编码器,成文,低维特征,特征向量,Means,软聚类,ACC,NMI,类指
AB值:
0.229255
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。