FAILED
首站-论文投稿智能助手
典型文献
基于软硬件协同加速的关系网络推理优化方法
文献摘要:
针对数据中心基于图形处理器(GPU)平台的关系网络推理计算中存在的低效能问题,本文提出了一种基于软硬件协同加速的关系网络优化方法.该方法采用基于GPU提取的支持集特征池与现场可编程门阵列(FPGA)推理异构协同的方式处理关系网络的推理计算,在高效能计算的同时保持关系网络的推理计算与GPU平台一致的准确率.利用基于高级综合(HLS)优化浮点卷积神经网络的计算方式,提高关系网络的处理能效.利用多运算单元异构多核处理的方式,满足FPGA时序收敛的同时,提升FPGA片上吞吐能力.本文在FPGA平台上实现了关系网络推理运算单元,在Omniglot数据集上构建的加速器功耗为15.867 W,相对于GPU加速比为1.4~17.2;在miniImageNet数据集上构建的加速器功耗为12.359 W,相对于GPU加速比为1.5~3.4.本文方法与同类FPGA加速浮点卷积神经网络相比,达到了最优的计算效能.实验数据表明,该方法有效利用了软硬件协同计算以及FPGA可重构计算的优势,降低了软硬件协同开发的耦合度,在保持关系网络推理计算准确率的同时,提升了关系网络推理的计算效能.
文献关键词:
关系网络;软硬件协同加速;卷积神经网络;异构多核
作者姓名:
张志超;王剑;章隆兵;肖俊华
作者机构:
计算机体系结构国家重点实验室(中国科学院计算技术研究所) 北京100190;中国科学院计算技术研究所 北京100190;中国科学院大学 北京100049;中国电子科技集团公司第十五研究所 北京100083
文献出处:
引用格式:
[1]张志超;王剑;章隆兵;肖俊华-.基于软硬件协同加速的关系网络推理优化方法)[J].高技术通讯,2022(04):327-336
A类:
B类:
软硬件协同加速,关系网络,数据中心,图形处理器,GPU,低效能,网络优化,现场可编程门阵列,FPGA,异构协同,高效能,HLS,浮点,点卷积,计算方式,异构多核,吞吐能力,推理运算,Omniglot,加速器,功耗,加速比,miniImageNet,算效,协同计算,可重构计算,协同开发,耦合度
AB值:
0.281154
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。