典型文献
基于Winograd算法的可重构卷积神经网络加速器
文献摘要:
神经网络被广泛应用于模式识别、预测分析、数据拟合等方面,是人工智能的重要基础.神经网络卷积计算量大且网络参数量多,导致了计算时间长且数据访存压力大等问题.针对以上问题,文中基于Winograd算法对卷积计算进行加速,设计了优化的硬件计算结构,提高了数据的复用效率和计算并行度.相较于滑窗卷积,文中所提加速器的计算效率提升了4.352倍.在卷积核梯度计算方面,该加速器采用优化的数据分配方式,减少了数据搬移且满足了多个PE并行计算的数据需求,与CPU相比性能提升了23倍.实验表明,该加速器在VGG-9网络模型下的卷积计算吞吐率可达192.55 GFLOPS,在训练后对CIFAR-10数据集的识别率为76.54%.
文献关键词:
CNN硬件加速器;Winograd;FPGA;可重构;卷积加速;多路并行;图像识别;VGG网络
中图分类号:
作者姓名:
袁子昂;倪伟;冉敬楠
作者机构:
合肥工业大学 微电子学院,安徽 合肥230601
文献出处:
引用格式:
[1]袁子昂;倪伟;冉敬楠-.基于Winograd算法的可重构卷积神经网络加速器)[J].电子科技,2022(12):35-42
A类:
B类:
Winograd,可重构,卷积神经网络加速器,模式识别,预测分析,数据拟合,卷积计算,计算量,网络参数,参数量,计算时间,算进,计算结构,复用,并行度,滑窗,计算效率,卷积核,数据分配,分配方式,数据搬移,PE,并行计算,数据需求,CPU,性能提升,VGG,吞吐率,GFLOPS,CIFAR,识别率,硬件加速器,FPGA,卷积加速,多路并行,图像识别
AB值:
0.478051
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。