首站-论文投稿智能助手
典型文献
面向端到端目标检测神经网络的高效硬件加速系统设计
文献摘要:
针对神经网络目标检测系统在硬件资源受限与功耗敏感的边缘计算设备中应用的问题,提出了一种基于现场可编程门阵列(FPGA)实现的YOLOv3-Tiny神经网络目标检测硬件加速系统.利用网络结构重组、层间融合与动态数值量化,缩减YOLOv3-Tiny网络规模.基于通道并行与权值驻留硬件加速算法、紧密流水线处理流程与硬件运算单元复用,提升硬件资源利用效率.所设计的端到端目标检测加速系统被部署在UltraScale+XCZU9EG FPGA上,达到了96.6 GOPS的吞吐量与17.3 FPS的检测帧率,功耗为4.12 W,并具有0.32 GOPS/DSP与2.68 GOPS/kLUT的硬件资源利用效率.在保持高效准确目标检测能力的同时,硬件资源利用效率优于其他已有的YOLOv3-Tiny目标检测硬件加速器.
文献关键词:
硬件加速;目标检测;现场可编程门阵列;端到端;YOLO算法
作者姓名:
任仕伟;刘朝钾;李剑铮;蒋荣堃;王晓华;薛丞博
作者机构:
北京理工大学集成电路与电子学院,北京 100081;北京理工大学重庆创新中心,重庆 401120;北京理工大学重庆微电子中心,重庆 401332
引用格式:
[1]任仕伟;刘朝钾;李剑铮;蒋荣堃;王晓华;薛丞博-.面向端到端目标检测神经网络的高效硬件加速系统设计)[J].北京理工大学学报,2022(12):1312-1320
A类:
UltraScale+XCZU9EG,kLUT
B类:
端到端,目标检测,硬件资源,资源受限,功耗,边缘计算,计算设备,现场可编程门阵列,FPGA,YOLOv3,Tiny,利用网络,结构重组,网络规模,权值,驻留,速算,流水线,处理流程,复用,资源利用效率,GOPS,吞吐量,FPS,帧率,DSP,检测能力,硬件加速器
AB值:
0.294513
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。