典型文献
一种傅里叶域海量数据高速谱聚类方法
文献摘要:
谱聚类方法广泛应用于数据挖掘和模式识别等领域,但大规模数据上高计算代价的特征向量求解及大数据带来的巨大内存需求,使得其应用于大规模数据时受到了极大的限制.为此,研究了基于傅里叶域的海量数据高速谱聚类方法.利用数据模式的重复性特点在傅里叶域建模,将耗时的特征向量计算转化为对预先确定的傅里叶域判别基进行选择来确定最终的特征向量,计算过程只需进行简单的乘法和加法运算,计算量得到极大的约减;分批次训练样本,使用部分样本即可估计出整体数据的特征向量分布,确定最终的特征向量,压缩了计算时间和内存需求.在Ijcnn1、RCV1、Covtype-mult、Poker及MNIST-8 M等大规模数据上的实验结果表明,所提方法在聚类精度等各项指标基本保持的前提下,训练时间相比FastESC、LSSHC、SC_RB、SSEIGS及USPEC等方法最高快了810.58倍,证明了所提方法在处理大规模聚类数据方面具有显著优势.
文献关键词:
谱聚类;傅里叶域;海量数据;高速计算;低内存需求
中图分类号:
作者姓名:
张熳;徐兆瑞;沈项军
作者机构:
江苏大学 计算机科学与通信工程学院,镇江212013
文献出处:
引用格式:
[1]张熳;徐兆瑞;沈项军-.一种傅里叶域海量数据高速谱聚类方法)[J].北京航空航天大学学报,2022(08):1445-1454
A类:
Ijcnn1,Covtype,mult,Poker,FastESC,LSSHC,SSEIGS,USPEC,低内存需求
B类:
傅里叶域,海量数据,谱聚类,聚类方法,模式识别,大规模数据,特征向量,大内,数据模式,预先确定,加法运算,计算量,分批,训练样本,分样,计算时间,RCV1,MNIST,聚类精度,训练时间,RB,聚类数,显著优势,高速计算
AB值:
0.275671
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。