首站-论文投稿智能助手
典型文献
面向高能效场景的神经网络结构和加速器协同设计
文献摘要:
神经网络算法和深度学习加速器已成为推动深度学习方法应用最重要的两股力量,但目前的神经网络结构设计主要围绕模型精度、计算量等指标,忽略了不同模型在目标加速器上计算效率的差异;而加速器设计一般针对既定的神经网络基准程序进行优化,往往难以覆盖到未来不断迭代进化的神经网络模型,这就容易导致加速器在新的网络架构上表现不佳.本质上,神经网络架构与加速器相对独立的设计流程,导致了两者的设计和优化不匹配,从而无法达到最优的深度学习推理性能.为此,本文提出了一种针对图像分类任务的网络结构和加速器软硬件协同设计的框架,将网络结构和加速器设计融合到统一的设计空间中,并针对设计约束,自动搜索最优协同设计方案,实现了端到端的深度学习推理定制和优化.实验表明,在真实的图像分类数据集和脉动阵列架构上,相对于传统的网络结构和加速器分别独立优化的方法,本文提出的协同设计方法实现了平均40%的能耗降低.
文献关键词:
神经网络结构设计;加速器设计;软硬件协同设计;设计空间探索
作者姓名:
陈维伟;王颖;张磊
作者机构:
中国科学院计算技术研究所 北京 100190;中国科学院大学 北京 100049
文献出处:
引用格式:
[1]陈维伟;王颖;张磊-.面向高能效场景的神经网络结构和加速器协同设计)[J].高技术通讯,2022(11):1143-1152
A类:
神经网络结构设计
B类:
高能效,神经网络算法,深度学习方法,两股,模型精度,计算量,上计,计算效率,加速器设计,既定,神经网络架构,设计流程,设计和优化,推理性,图像分类,分类任务,软硬件协同设计,设计融合,合到,设计约束,自动搜索,端到端,理定,分类数据,脉动阵列,分别独立,设计空间探索
AB值:
0.286111
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。