首站-论文投稿智能助手
典型文献
基于谱聚类的高维类别属性数据流离群点挖掘算法
文献摘要:
为及时发现数据流中的异常数据、降低网络潜在威胁,提出了基于谱聚类的高维类别属性数据流离群点挖掘算法.分析了数据流具有有序性、高速性和高维性等特征,并探究了离群点的主要来源;利用属性权值量化方法,引入信息熵,将具有较强关联性的数据流合并,进而对数据流进行降维以减少干扰;采用谱聚类算法设置关键尺度参数,通过亲和矩阵计算样本与目标之间的距离,将谱聚类变换为无向图分割问题,获取特征矩阵,提取显著的离群点特征;使用距离挖掘方式,在数据流中加入数据块,判断两个邻近数据块之间的概率分布情况,设定滑动窗口,获取数据与滑动窗口间的距离,再与设定的阈值做比较,将离群点加入到集合中完成挖掘.仿真实验结果证明,对于不同大小和不同维度的数据流,该算法所需的执行时间分别在42 s和40 s内,对于数据流大小和维度具有较好的伸缩性,且挖掘出的离群点数据与实际相符.
文献关键词:
计算机应用;谱聚类算法;高维类别属性;数据流;离群点挖掘;滑动窗口
作者姓名:
康耀龙;冯丽露;张景安;陈富
作者机构:
山西大同大学计算机与网络工程学院,山西大同037009;山西大同大学教育科学与技术学院,山西大同037009;山西大同大学计算机网络中心,山西大同037009;山西大同大学数学与统计学院,山西大同 037009
引用格式:
[1]康耀龙;冯丽露;张景安;陈富-.基于谱聚类的高维类别属性数据流离群点挖掘算法)[J].吉林大学学报(工学版),2022(06):1422-1427
A类:
高维类别属性,离群点挖掘
B类:
属性数据,数据流,流离,挖掘算法,异常数据,有序性,高速性,高维性,权值,量化方法,信息熵,流进,谱聚类算法,尺度参数,亲和矩阵,矩阵计算,图分割,特征矩阵,点特征,数据块,概率分布,滑动窗口,获取数据,口间,同大,不同维度,执行时间,伸缩性,挖掘出,离群点数据,计算机应用
AB值:
0.301795
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。