典型文献
YOLO检测网络的FPGA加速计算模型的研究
文献摘要:
FPGA(Field Programmable Gate Array)凭借其高并行和可定制化的特点,可以解决目标检测网络结构复杂、计算量大和存储开销高等问题.本文基于FPGA验证平台研究并实现了 YOLO(You Only Look Once)系列神经网络的加速计算模型.首先采用动态定点量化方法降低了数据存储和传输量.然后针对YOLO模型中两类计算开销大的典型卷积层,采用了流水线,循环展开,模块融合等策略分别实现了基于Winograd和GEMM的快速卷积计算引擎,提高加速计算效率.实验结果表明,本文在PYNQ-Z1验证平台上获得的计算性能达到64.9 GOP/s,比基于典型滑动窗口卷积计算方法的性能提高了 2.15倍.
文献关键词:
FPGA;YOLO;快速卷积算法;并行计算;流水线
中图分类号:
作者姓名:
裴颂文;汪显荣
作者机构:
上海理工大学光电信息与计算机工程学院,上海200093;中国科学院计算技术研究所计算机体系结构国家重点实验室,北京100190;复旦大学上海市数据科学重点实验室,上海200433
文献出处:
引用格式:
[1]裴颂文;汪显荣-.YOLO检测网络的FPGA加速计算模型的研究)[J].小型微型计算机系统,2022(08):1681-1686
A类:
B类:
YOLO,FPGA,Field,Programmable,Gate,Array,可定制化,目标检测网络,计算量,存储开销,验证平台,平台研究,You,Only,Look,Once,定点量化,量化方法,数据存储,输量,计算开销,卷积层,流水线,循环展开,模块融合,Winograd,GEMM,卷积计算,高加速,计算效率,PYNQ,Z1,GOP,比基,滑动窗口,性能提高,快速卷积算法,并行计算
AB值:
0.566166
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。