典型文献
TensorFlow框架中OpenCL算子的实现及集成
文献摘要:
[目的]目前,TensorFlow这一主流机器学习框架与CUDA异构编程环境的组合在学术界与工业界得到大量使用,使用CUDA实现的TensorFlow算子是加速计算的关键.然而,TensorFlow对于OpenCL这一开放通用的异构编程标准的不支持严重限制了TensorFlow的通用性,并导致OpenCL硬件设备的算力无法充分发挥.[方法]针对此问题,本文深入探索TensorFlow的底层实现,在对TensorFlow代码结构深入分析的基础上实现了OpenCL算子,并且在2.2.0版本的TensorFlow框架实现了OpenCL算子的集成.[结果]基于上述实现,TensorFlow能够借助OpenCL算子在支持OpenCL 1.2的硬件设备上运行.同时,本文提出的优化方法也大幅提升了OpenCL算子的计算效率.[结论]通过实验表明,本文提出的方法能够有效地解决TensorFlow无法应用在OpenCL硬件设备上的问题.
文献关键词:
TensorFlow;OpenCL;算子
中图分类号:
作者姓名:
郭强;程大果;孙羽菲;周建宇;张玉志;裴嘉傲;甘润东;陈锐
作者机构:
南开大学,软件学院,天津 300450
文献出处:
引用格式:
[1]郭强;程大果;孙羽菲;周建宇;张玉志;裴嘉傲;甘润东;陈锐-.TensorFlow框架中OpenCL算子的实现及集成)[J].数据与计算发展前沿,2022(02):3-16
A类:
异构编程环境
B类:
TensorFlow,OpenCL,CUDA,工业界,一开,不支,通用性,硬件设备,算力,代码,计算效率
AB值:
0.173157
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。