FAILED
首站-论文投稿智能助手
典型文献
神经网络加速器指令控制系统设计
文献摘要:
深度神经网络在图像语音智能化处理领域的应用越来越广泛,但其算子、参数类型多,计算、存储密集大的特点制约了在航空航天、移动智能终端等嵌入式场景中的应用.针对这一问题,提出了解耦输入数据流,进行高效流水并行处理的思路,设计了 一种神经网络加速器指令控制系统.不同算子的输入数据循环分块后,对应到指令组配置中,多状态机协同完成指令信息三阶段分发控制,实现指令解析、数据输入、计算、数据输出四级并行流水,充分利用分块内的数据复用机会,减少访存带宽及流水周期空闲率.将其部署在ZCU102开发板上,测试中支持常见的多种神经网络层类型和宽范围参数配置.频率为200 M时,峰值算力800 GOPS,运行VGG16网络模型,实际测试运行算力为489.4 GOPS,功耗4.42 W,能效比为113.3 GOPS/W,优于调研对比的同类神经网络加速器和CPU、GPU.实验结果表明,分解数据流,采用指令调度实现高效并行流水的方法解决了通用性和能效比两大难题,基于此方法设计的指令控制系统,可为神经网络加速器的嵌入式平台应用提供方案.
文献关键词:
深度神经网络;神经网络加速器;指令控制系统;通用性;能效比
作者姓名:
焦峰;马瑶;毕思颖;马钟
作者机构:
西安微电子技术研究所,陕西西安710000
引用格式:
[1]焦峰;马瑶;毕思颖;马钟-.神经网络加速器指令控制系统设计)[J].微电子学与计算机,2022(08):78-85
A类:
指令控制系统
B类:
神经网络加速器,控制系统设计,深度神经网络,智能化处理,航空航天,移动智能终端,嵌入式场景,解耦,输入数据,数据流,并行处理,分块,应到,组配,多状态,状态机,指令信息,四级,数据复用,空闲,ZCU102,开发板,中支,网络层,宽范围,参数配置,算力,GOPS,VGG16,实际测试,测试运行,功耗,能效比,类神经网络,CPU,GPU,解数,通用性,方法设计,嵌入式平台,平台应用
AB值:
0.331089
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。