首站-论文投稿智能助手
典型文献
基于MobileNet-SSD目标检测算法的硬件加速器设计
文献摘要:
人工智能的迅速发展使得现代卷积神经网络在图像识别和分类任务上取得了巨大成功.然而,复杂神经网络模型不断向更深层的网络结构发展,在面积、功耗受限的移动设备上部署时无法保持高性能和高精度.针对该问题,面向可编程阵列芯片(FPGA)平台提出了一种基于软硬件协同方法的MobileNet-SSD目标检测硬件加速器设计.首先采用剪枝和量化算法对原始MobileNet-SSD模型进行压缩,其中剪枝是针对点卷积层参数冗余问题而提出的卷积核剪枝算法,量化则是将训练后的网络模型中的浮点数统一转换为定点数参与卷积计算.然后,设计了一种可配置的卷积计算加速阵列,通过循环分块实现不同规模网络层的多粒度并行.在此基础上,进一步设计了一种针对输入缓存的行缓存优化机制,结合直接存取存储器(DMA)和数据流接口传输数据解决传输延迟的瓶颈.实验表明,所提出的目标检测系统的性能功耗比相较于CPU和GPU分别提升了 79倍和1.9倍,相比于以往工作中提出的目标检测系统具有更高的准确度和更优的性能.
文献关键词:
目标检测;FPGA;加速器;软硬件协同设计
作者姓名:
施思雨;魏继增
作者机构:
天津大学智能与计算学部,天津300350
引用格式:
[1]施思雨;魏继增-.基于MobileNet-SSD目标检测算法的硬件加速器设计)[J].微电子学与计算机,2022(06):99-107
A类:
直接存取
B类:
MobileNet,SSD,目标检测算法,硬件加速器,加速器设计,图像识别,分类任务,巨大成功,功耗,移动设备,可编程,FPGA,协同方法,量化算法,点卷积,卷积层,卷积核,剪枝算法,浮点数,定点数,卷积计算,可配置,分块,不同规模,网络层,多粒度,缓存,优化机制,存储器,DMA,数据流,口传,传输数据,传输延迟,CPU,GPU,软硬件协同设计
AB值:
0.369309
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。