典型文献
Kubernetes集群上深度学习负载优化
文献摘要:
人工智能技术的快速发展和在云原生上部署应用高效等优点让越来越多的开发者和互联网企业将人工智能应用部署在Kubernetes集群上,但Kubernetes并不是主要针对深度学习而设计,对深度学习这个特定领域需要做定制优化.本文针对具有一定规模的Kubernetes集群上部署深度学习负载的场景,设计和实现了一系列优化方案,主要从深度学习所要求的数据处理、graphics processing unit(GPU)计算、分布式训练等几个方面进行优化,本文提出的优化方案覆盖了数据处理、计算等方面,这些技术极大简化人工智能负载在规模化云原生平台上的部署难度和提高运行效率.同时从实践上来看也验证了以 上技术对人工智能应用有着显著的提升作用.
文献关键词:
Kubernetes;深度学习;分布式训练;CUDA;负载优化;人工智能
中图分类号:
作者姓名:
陈培;王超;段国栋;王德奎;王斌;王文潇;孙辽东;荆荣讯;邢良占;刘慧兴;姬贵阳
作者机构:
浪潮电子信息产业股份有限公司,济南250101
文献出处:
引用格式:
[1]陈培;王超;段国栋;王德奎;王斌;王文潇;孙辽东;荆荣讯;邢良占;刘慧兴;姬贵阳-.Kubernetes集群上深度学习负载优化)[J].计算机系统应用,2022(09):114-126
A类:
B类:
Kubernetes,负载优化,云原生,开发者,互联网企业,人工智能应用,应用部署,特定领域,设计和实现,所要,graphics,processing,unit,GPU,分布式训练,生平,提高运行效率,提升作用,CUDA
AB值:
0.355898
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。