首站-论文投稿智能助手
典型文献
基于OpenCL的TensorFlow框架中Element-Wise算子实现
文献摘要:
[目的]深度学习模型以较强的建模性能和优秀的多场景适应能力被广泛应用于各类典型人工智能领域.目前通常采用异构并行计算技术满足深度学习模型的算力需求,然而目前深度学习框架普遍使用CUDA或ROCm等编程模型,仅能支持特定厂商设备;对于通用异构计算设备,需要通过OpenCL编程标准实现支持,因此我们着力于实现TensorFlow框架的OpenCL版本.[方法]本文对TensorFlow框架中主要基于Eigen库提供的接口实现的Element-Wise算子进行代码分析,拆解对应结构体和类的封装方式,并基于OpenCL的编程标准对Element-Wise算子进行实现和封装,确保了代码的规范性和可扩展性.[结果]本文以CUDA算子为基准,对OpenCL的Element-Wise算子进行测试和对比,实验结果分别从正确性和计算效率两方面验证了本文OpenCL版本算子实现的可行性.[结论]作为实现OpenCL版本的TensorFlow框架这一工作的重要组成部分,本文成功实现了TensorFlow框架中Element-Wise算子的OpenCL版本,并经过实验验证了本文实现的算子的计算准确性和计算效率.
文献关键词:
OpenCL;TensorFlow;核函数
作者姓名:
隋轶丞;石昌青;孙羽菲;张玉志;陈禹乔;张宇哲
作者机构:
南开大学,软件学院,天津 300350;先进计算与关键软件海河实验室,天津 300350
引用格式:
[1]隋轶丞;石昌青;孙羽菲;张玉志;陈禹乔;张宇哲-.基于OpenCL的TensorFlow框架中Element-Wise算子实现)[J].数据与计算发展前沿,2022(03):19-29
A类:
ROCm
B类:
OpenCL,TensorFlow,Element,Wise,子实,深度学习模型,多场景,人工智能领域,异构并行,并行计算,计算技术,算力,深度学习框架,CUDA,厂商,异构计算,计算设备,Eigen,口实,代码分析,拆解,结构体,封装,可扩展性,计算效率,文成,计算准确性,核函数
AB值:
0.304134
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。