首站-论文投稿智能助手
典型文献
面向大规模二部图的分布式Tip分解算法
文献摘要:
Tip分解作为图数据管理领域的热点研究问题,已被广泛应用于文档聚类和垃圾邮件组检测等实际场景中.随着图数据规模的爆炸式增长,单机内存已无法满足其存储需求,亟需研究分布式环境下Tip分解技术.现有分布式图计算系统的通信模式无法适用于二部图,为此,首先提出一种基于中继的通信模式,以实现分布式环境下处理二部图时消息的有效传递;其次,提出分布式butterfly计数算法(DBC)和tip分解算法(DTD),特别地,为解决处理大规模二部图时DBC面临的内存溢出问题,提出了一种可控的并行顶点激活策略;最后,引入基于顶点优先级的消息剪枝策略和消息有效性剪枝策略,通过减少冗余通信和计算开销,进一步提高算法效率.实验平台部署于国家超算中心高性能分布式集群上,在多个真实数据集上的实验结果验证了所提算法的有效性和高效性.
文献关键词:
二部图;butterfly计数;分布式系统;tip分解
作者姓名:
周旭;翁同峰;杨志邦;李博仁;张吉;李肯立
作者机构:
湖南大学信息科学与工程学院,湖南长沙410082;之江实验室,浙江杭州311100;国家超级计算长沙中心,湖南长沙410082
文献出处:
引用格式:
[1]周旭;翁同峰;杨志邦;李博仁;张吉;李肯立-.面向大规模二部图的分布式Tip分解算法)[J].软件学报,2022(03):1043-1056
A类:
B类:
二部图,Tip,解作,图数据,数据管理,管理领域,热点研究,研究问题,文档,垃圾邮件,爆炸式,单机,机内,研究分布,分布式环境,分解技术,式图,图计算系统,通信模式,中继,下处,有效传递,butterfly,数算,DBC,tip,DTD,顶点,优先级,剪枝,冗余通信,计算开销,算法效率,实验平台,平台部署,超算中心,真实数据,分布式系统
AB值:
0.435776
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。