FAILED
首站-论文投稿智能助手
典型文献
一种微指令序列调度数据流的星载卷积神经网络FPGA加速器
文献摘要:
卷积神经网络(Convolutional Neural Network,CNN)是目前主流视觉算法不可或缺的关键部分.为提高CNN模型推理速度,学界提出了众多异构加速方法以满足不同场景下的多元加速需求.但如何在资源与能耗受限的在轨卫星上稳定高效地加速CNN仍是极具挑战的课题.为此,本文通过软硬件协同设计,着力优化微指令编码、指令级并行和运算级并行3个加速器设计的关键部分,在星上常见的Xilinx VX690T FPGA芯片上设计实现了一种微指令序列调度数据流的CNN加速器.在软件层面,本文提出一种可扩展的微指令编码格式及相应的编译方法.通过卷积循环分块和算子融合策略实现图级别优化,生成加速器可执行的微指令序列.在硬件层面,本文设计实现了一个由微控制器与逻辑运算器组成的RTL级CNN加速器.微控制器通过粗粒度流水线实现各类指令的并行执行.逻辑运算器通过DSP48E1计算资源级联所构建的计算阵列实现卷积算子的细粒度并行运算.实验结果表明,加速器设计功耗10.68W,在加速YOLO V3Tiny算法时,峰值吞吐率(Runtime Max Throughput,RMT)达到378.63GOP/s,计算资源利用效率(MAC Efficiency,ME)达到91.5%.相较典型GPU加速方法,本文的加速器有14倍能效提升.相较同类FPGA加速器,ME有6.9%以上的提升.
文献关键词:
卷积神经网络;微指令序列;现场可编程逻辑门阵列;遥感目标检测;微处理器设计
作者姓名:
郭子博;刘凯;胡航天;李奕铎;璩泽旭
作者机构:
西安电子科技大学计算机科学与技术学院 西安 710000;中国空间技术研究院西安分院 西安 710000
文献出处:
引用格式:
[1]郭子博;刘凯;胡航天;李奕铎;璩泽旭-.一种微指令序列调度数据流的星载卷积神经网络FPGA加速器)[J].计算机学报,2022(10):2047-2064
A类:
微指令,微指令序列,指令编码,VX690T,DSP48E1,68W,V3Tiny,63GOP
B类:
列调,数据流,星载,FPGA,Convolutional,Neural,Network,视觉算法,模型推理,推理速度,异构加速,加速方法,同场,在轨卫星,稳定高效,软硬件协同设计,指令级,加速器设计,Xilinx,设计实现,可扩展,编码格式,编译,分块,和算,融合策略,微控制器,逻辑运算,运算器,RTL,粗粒度,流水线,类指,并行执行,计算资源,卷积算子,细粒度,并行运算,功耗,YOLO,吞吐率,Runtime,Max,Throughput,RMT,资源利用效率,MAC,Efficiency,ME,GPU,能效提升,现场可编程逻辑门阵列,遥感目标检测,微处理器设计
AB值:
0.343803
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。