首站-论文投稿智能助手
典型文献
结合PCA的t-SNE算法的并行化实现方法
文献摘要:
为了提高大数据环境下高维非线性数据的处理速度和精确度,提出一种结合主成分分析(PCA)的基于t分布的随机近邻嵌入(t-SNE)算法.首先,通过主成分分析法对原始数据进行预处理,去除噪声点;然后,结合t-SNE算法,构建K最邻近(K-NN)图,以表示高维空间中数据的相似关系;最后,在Spark平台上进行并行化运算,并在BREAST CANCER,MNIST和CIFAR-10数据集上进行实验.结果表明:文中算法完成了高维数据至低维空间的有效映射,提升了算法的效率和精确度,可应用于大规模高维数据的降维.
文献关键词:
高维数据;Spark平台;降维;可视化;t-SNE算法
作者姓名:
徐旸;王佳斌;彭凯
作者机构:
华侨大学工学院,福建泉州362021
引用格式:
[1]徐旸;王佳斌;彭凯-.结合PCA的t-SNE算法的并行化实现方法)[J].华侨大学学报(自然科学版),2022(05):685-692
A类:
CANCER
B类:
SNE,并行化,实现方法,大数据环境下,处理速度,随机近邻嵌入,原始数据,除噪声,噪声点,NN,高维空间,相似关系,Spark,BREAST,MNIST,CIFAR,高维数据,低维空间
AB值:
0.357366
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。