典型文献
基于卷积神经网络的目标检测硬件加速器设计
文献摘要:
基于卷积神经网络的深度学习算法的检测识别精度已远远超过了传统模式识别算法,但卷积神经网络中的卷积、非线性激活等运算,需要巨大的算力才能高效率实现,这使得很多深度学习算法模型难以在算力限制的嵌入式平台上进行部署.以目标检测算法YOLO-V3为例,针对网络的不同层设计了对应的FPGA实现方法,并且特别针对卷积层设计了分片分块并行运算的运算单元,最终在FPGA中实现了 一种目标检测硬件加速器.该加速器可充分利用FPGA的硬件计算资源,其整体平均性能为192.229 GOP/s.通过实验对比,证明该目标检测硬件加速器可以为嵌入式红外目标识别系统提供一种能效高、识别精度高的解决方案.
文献关键词:
卷积神经网络;神经网络硬件加速器;嵌入式;目标检测
中图分类号:
作者姓名:
程文韶;范强;邹尔博
作者机构:
华中光电技术研究所一武汉光电国家研究中心,湖北武汉430223
文献出处:
引用格式:
[1]程文韶;范强;邹尔博-.基于卷积神经网络的目标检测硬件加速器设计)[J].光学与光电技术,2022(05):108-114
A类:
分块并行
B类:
加速器设计,深度学习算法,检测识别,识别精度,已远,远超过,传统模式,模式识别,识别算法,算力,算法模型,嵌入式平台,行部,目标检测算法,YOLO,V3,FPGA,实现方法,别针,卷积层,分片,并行运算,计算资源,GOP,实验对比,红外目标识别,识别系统,神经网络硬件加速器
AB值:
0.310946
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。