典型文献
大规模脉冲星候选体信号的无监督聚类分析研究
文献摘要:
随着500 m 口径球面射电望远镜(Five-hundred-meter Aperture Spherical radio Telescope,FAST)等大型射电望远镜的建设和使用,脉冲星巡天数据进入PB时代.为解决如此大量高速采样的标量数据挖掘问题,促进新天文现象的发现,提出一种基于无监督聚类的脉冲星候选体筛选方案.该方案采用基于密度层次、划分方法的混合聚类算法,结合MapReduce/Spark并行计算模型和基于滑动窗口的分组策略,进而提高大量候选体信号筛选的效率.通过在脉冲星数据集HTRU2(High Time Resolution Universe)上的对比实验,结果表明该算法能取得较高的精确度和召回率,分别是0.946和0.905,并且当并行节点足够时,该算法的时间复杂度相比串行执行明显下降.可见,该方法为脉冲星观测大数据的分析挖掘提供一种可行思路.
文献关键词:
脉冲星:普通;数据集:HTRU2;方法:混合聚类;方法:无监督
中图分类号:
作者姓名:
刘莹;马智;游子毅;王培;党世军;赵汝双;董爱军
作者机构:
贵州师范大学物理与电子科学学院 贵阳550025;中国科学院国家天文台 北京100012
文献出处:
引用格式:
[1]刘莹;马智;游子毅;王培;党世军;赵汝双;董爱军-.大规模脉冲星候选体信号的无监督聚类分析研究)[J].天文学报,2022(03):127-136
A类:
HTRU2
B类:
脉冲星,无监督聚类,口径,球面,射电望远镜,Five,hundred,meter,Aperture,Spherical,radio,Telescope,FAST,巡天,PB,高速采样,标量,天文,基于密度,划分方法,混合聚类,聚类算法,MapReduce,Spark,并行计算,滑动窗口,分组策略,High,Time,Resolution,Universe,能取,召回率,时间复杂度,串行
AB值:
0.460775
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。