首站-论文投稿智能助手
典型文献
WinoNet:基于LUT的可配置Winograd多精度卷积网络加速器
文献摘要:
为了解决卷积层计算复杂度要求高和硬件网络推理的硬件资源有限造成的硬件部署问题,在基于查找表(LUT)的现场可编程门阵列(FPGA)上搭建了使用整数乘法器和加法树的卷积架构.借助 Winograd算法实现卷积乘法优化,降低了计算复杂度.进一步优化基于LUT的算子,以构建处理单元(PE).优化存储流以提高内存访问效率并解决带宽限制,降低数据翻转率以减少功耗.试验结果表明,使用Winograd算法构建基本处理单元可以显著减少乘法器数量并实现硬件部署加速,而处理单元的时分复用提高了资源利用率.与传统卷积方法相比,架构对计算资源实现了 2.25倍优化,并将峰值吞吐量提升了 19.3倍.由此说明,基于LUT的可配置Winograd网络加速器可以有效解决硬件资源有限造成的部署问题.
文献关键词:
量化神经网络;基于LUT的乘法器;Winograd算法;任意精度
作者姓名:
王成诚;李鹤;曹闫鹏;宋长俊;俞峰;汤勇明
作者机构:
东南大学电子科学与工程学院,南京210096
引用格式:
[1]王成诚;李鹤;曹闫鹏;宋长俊;俞峰;汤勇明-.WinoNet:基于LUT的可配置Winograd多精度卷积网络加速器)[J].东南大学学报(英文版),2022(04):332-339
A类:
WinoNet
B类:
LUT,可配置,Winograd,多精度,卷积网络,网络加速,加速器,卷积层,计算复杂度,硬件资源,硬件部署,查找表,现场可编程门阵列,FPGA,整数乘法,乘法器,加法,算法实现,处理单元,PE,宽限,功耗,本处,时分复用,资源利用率,计算资源,吞吐量,量化神经网络,任意精度
AB值:
0.350851
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。