FAILED
首站-论文投稿智能助手
典型文献
基于ZYNQ平台的通用卷积加速器设计
文献摘要:
卷积神经网络(CNN)计算量大主要在于卷积运算复杂,因而难以在边缘端计算设备中应用.对此提出了一种基于ZYNQ平台的硬件通用卷积加速器设计方案,该加速器对所有卷积神经网络的卷积层适用,为目标检测领域的产品应用拓宽了市场前景.选用YOLOv3-Tiny网络进行分析,采用定点量化方法,损失较小精度获得8倍速度性能提升.针对硬件级加速器设计,用软核CPU代替硬核CPU,进一步提高资源利用率;根据卷积计算特点,优化了乘加运算及缓存机制,并采用流水线及并行处理等操作进行硬件加速.实验结果表明,该方案模型均值平均精度69%,硬件级实现了 210 fps的前向推理速度,整体系统功耗控制在5W以内.
文献关键词:
卷积神经网络;ZYNQ;硬件加速
作者姓名:
缪丹丹;张鹏;张鑫宇;崔敏
作者机构:
中北大学仪器与电子学院 太原030051
引用格式:
[1]缪丹丹;张鹏;张鑫宇;崔敏-.基于ZYNQ平台的通用卷积加速器设计)[J].国外电子测量技术,2022(11):72-77
A类:
B类:
ZYNQ,卷积加速,加速器设计,计算量,卷积运算,边缘端,计算设备,卷积层,目标检测,检测领域,产品应用,市场前景,YOLOv3,Tiny,定点量化,量化方法,倍速,性能提升,软核,CPU,硬核,高资源利用率,卷积计算,缓存机制,流水线,并行处理,硬件加速,均值平均精度,fps,推理速度,整体系统,功耗控制,5W
AB值:
0.487775
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。