典型文献
基于ZCU102 DSP的CNN卷积运算加速方法
文献摘要:
本文提出设计了一种在ZCU102平台上加速卷积神经网络(CNN)卷积运算的方法,使用1个DSP IP实现卷积操作中1个int8类型或者unit8类型输入特征图像数据和2个int8类型卷积核参数的乘法运算.卷积运算是卷积神经网络的基本操作,提高卷积运算并行度可使卷积运算速率提升一倍.8-bit卷积神经网络量化技术是设计实现的基础,减少了处理器(PS)数据传输带宽需求.ZCU102 MPSoC的可编程逻辑(PL)资源较少,充分利用DSP IP资源可降低逻辑资源需求,提升逻辑资源利用率,增加SoC系统设计灵活性.
文献关键词:
ZCU102;DSP IP;人工智能;卷积神经网络;8-bit量化
中图分类号:
作者姓名:
苗鑫;周欢欢;陆栋洵
作者机构:
沐曦集成电路(南京)有限公司,江苏 南京 210000
文献出处:
引用格式:
[1]苗鑫;周欢欢;陆栋洵-.基于ZCU102 DSP的CNN卷积运算加速方法)[J].自动化技术与应用,2022(12):64-67
A类:
int8,unit8,卷积神经网络量化
B类:
ZCU102,DSP,卷积运算,加速方法,卷积操作,输入特征,特征图像,图像数据,卷积核,核参数,乘法运算,算是,基本操作,并行度,速率提升,一倍,bit,设计实现,处理器,数据传输,传输带宽,带宽需求,MPSoC,可编程,PL,资源需求,资源利用率
AB值:
0.338322
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。