首站-论文投稿智能助手
典型文献
面向目标检测的卷积神经网络优化方法
文献摘要:
针对星载等功耗受限平台下遥感影像目标检测存在的高准确率、低功耗以及高吞吐量等要求,本文提出了一种面向目标检测的现场可编程门阵列(FPGA)卷积神经网络(CNN)优化方法.采用数据流调度技术以及基于乘法矩阵与前向加法链的卷积计算阵列设计对浮点卷积神经网络模型进行加速.利用该方法在FPGA开发板上实现了浮点卷积目标检测网络,在应用中达到了与原模型一致的准确率,平均准确率为97.59%,吞吐量达到了Titan X的22倍.与同类的FPGA加速浮点卷积方法对比,该方法的吞吐量以及能效比达到了最优.实验数据表明,该方案突破了浮点卷积加速的线速吞吐难点,解决了应用中存在的功耗、准确率以及吞吐量三者制衡的问题.
文献关键词:
卷积神经网络(CNN);现场可编程门阵列(FPGA);数据流调度;目标检测;加速
作者姓名:
张志超;王剑;章隆兵;肖俊华
作者机构:
计算机体系结构国家重点实验室(中国科学院计算技术研究所) 北京100190;中国科学院计算技术研究所 北京100190;中国科学院大学 北京100049;中国电子科技集团公司第十五研究所 北京100083
文献出处:
引用格式:
[1]张志超;王剑;章隆兵;肖俊华-.面向目标检测的卷积神经网络优化方法)[J].高技术通讯,2022(03):227-238
A类:
B类:
面向目标,神经网络优化,星载,台下,遥感影像,低功耗,高吞吐量,现场可编程门阵列,FPGA,数据流调度,调度技术,加法,法链,卷积计算,阵列设计,浮点,点卷积,卷积神经网络模型,开发板,目标检测网络,中达,平均准确率,Titan,方法对比,能效比,比达,卷积加速,制衡
AB值:
0.312
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。