首站-论文投稿智能助手
典型文献
基于ARM+FPGA异构平台的目标检测加速模块设计与实现
文献摘要:
为解决基于深度学习目标检测模型规模大、在边缘设备上难以部署的问题,以YOLO目标检测模型为例,设计实现基于ARM+FPGA异构平台的目标检测加速模块.该系统使用剪枝、量化后的压缩模型,在FPGA实现神经网络前向推理加速,在ARM中实现加速器调度.实验结果表明,部署至Xilinx ZCU102开发板上,该模块在200 MHz工作频率下,平均计算性能达到425.8 GOP/s,推理压缩模型速度达到30.3 fps,模块功耗为3.56 W,证明该加速模块具备可配置性.
文献关键词:
深度学习;目标检测;模型剪枝量化;异构平台;边缘计算
作者姓名:
李放;曹健;李普;谢豪;赵雄波;王源;张兴
作者机构:
北京大学软件与微电子学院, 北京 102600;北京航天自动控制研究所, 北京 100070;北京大学集成电路学院, 北京 100871
引用格式:
[1]李放;曹健;李普;谢豪;赵雄波;王源;张兴-.基于ARM+FPGA异构平台的目标检测加速模块设计与实现)[J].北京大学学报(自然科学版),2022(06):1035-1041
A类:
模型剪枝量化,剪枝量
B类:
ARM+FPGA,异构平台,模块设计,学习目标,目标检测模型,边缘设备,YOLO,设计实现,压缩模型,推理加速,加速器,Xilinx,ZCU102,开发板,MHz,工作频率,GOP,fps,功耗,可配置,边缘计算
AB值:
0.407548
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。