首站-论文投稿智能助手
典型文献
数据密集作业在GPU集群上的调度算法研究
文献摘要:
数据密集型作业包含大量的任务,使用GPU设备来提高任务的性能是目前的主要手段.但是,在解决数据密集型作业之间的GPU资源公平共享以及降低任务所需数据在网络间的传输代价方面,现有的研究方法没有综合考虑资源公平与数据传输代价的矛盾.分析了GPU集群资源调度的特点,提出了一种基于最小代价最大任务数的GPU集群资源调度算法,解决了GPU资源的公平分配与数据传输代价较高的矛盾.将调度过程分为两个阶段:第1阶段为各个作业按照数据传输代价给出自己的最优方案;第2阶段为资源分配器合并各个作业的方案,按照公平性给出全局的最优方案.首先,给出了GPU集群资源调度框架的总体结构,各个作业给出自己的最优方案,资源分配进行全局优化;第二,给出了网络带宽估计策略以及计算任务的数据传输代价的方法;第三,给出了基于GPU数量的资源公平分配的基本算法;第四,提出了最小代价最大任务数的资源调度算法,描述了资源非抢夺、抢夺以及不考虑资源公平策略的实现策略;最后,设计了6种数据密集型计算作业,对所提出的算法进行了实验.通过实验验证,最小代价最大任务数的资源调度算法对于资源公平性能够达到90%左右,同时亦能保证作业并行运行时间最小.
文献关键词:
GPU;数据密集型;最小代价;公平性;数据本地化
作者姓名:
汤小春;朱紫钰;毛安琪;符莹;李战怀
作者机构:
西北工业大学 计算机学院,陕西 西安 710129
文献出处:
引用格式:
[1]汤小春;朱紫钰;毛安琪;符莹;李战怀-.数据密集作业在GPU集群上的调度算法研究)[J].软件学报,2022(12):4429-4451
A类:
B类:
GPU,算法研究,数据密集型,数据传输,最小代价,大任务,资源调度算法,公平分配,照数,最优方案,资源分配,分配器,公平性,调度框架,总体结构,全局优化,网络带宽,带宽估计,估计策略,抢夺,实现策略,算作,行运,运行时间,数据本地化
AB值:
0.254697
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。