典型文献
在轨高效目标检测加速技术
文献摘要:
针对深度卷积网络目标检测算法参数量大、计算量大以及受星上计算资源、存储资源及功耗的限制,难以实现在轨部署的问题,提出了一种在轨高效目标检测算法加速框架与实现方法.首先,设计了一种可以同时兼容三种卷积算子的计算引擎,有效提高了资源利用率;其次,从通道和卷积核两个维度将目标检测算法模型展开,实现了加速器的高度并行化和可扩展性;最后,在多种FPGA平台上实现了该加速器并对其性能进行了评估.实验结果表明:所提出的加速器计算性能可以达到1843.2 GFLOPs(每秒千兆次浮点运算),推理时间为0.22 ms.与同类加速器方案相比,所提出的加速器框架在性能、功耗、能效比及推理时间方面具有很大优势,适合部署在资源受限环境中,具有良好的星上应用前景和价值.
文献关键词:
目标检测;模型量化;模型加速;计算强度;卷积神经网络
中图分类号:
作者姓名:
呼延烺;李映;蒋冬梅;张艳宁;周诠;魏佳圆;刘娟妮
作者机构:
西北工业大学计算机学院,西安710129;空间微波技术国家级重点实验室,西安710100
文献出处:
引用格式:
[1]呼延烺;李映;蒋冬梅;张艳宁;周诠;魏佳圆;刘娟妮-.在轨高效目标检测加速技术)[J].宇航学报,2022(11):1544-1556
A类:
B类:
在轨,加速技术,深度卷积网络,目标检测算法,算法参数,参数量,计算量,上计,计算资源,存储资源,功耗,难以实现,实现方法,卷积算子,资源利用率,卷积核,算法模型,加速器,并行化,可扩展性,FPGA,GFLOPs,每秒,千兆,浮点运算,推理时间,ms,能效比,资源受限,受限环境,模型量化,模型加速,计算强度
AB值:
0.482321
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。