典型文献
基于FPGA的高效卷积神经网络设计
文献摘要:
作为深度学习的代表算法之一,卷积神经网络因为拥有良好的特征提取能力而被广泛应用于计算机视觉、自然语言处理等领域.然而,因为卷积神经网络拥有庞大的计算量,主流的硬件平台往往不能满足模型的各种需求.例如,CPU受限于自身架构无法提供高效的算力;GPU因功耗太高而无法满足移动设备需求;ASIC开发周期较长,成本较高,难以实现设计的复用.现场可编程逻辑门阵列是一种半定制电路,拥有计算力强、功耗低等特点,其并行化的结构特点正适用于卷积神经网络模型的搭建.针对MINST数据集,该文提出了一种卷积神经网络模型的设计思路及优化方法,并利用VIVADO HLS工具在FPGA平台上完成卷积神经网络模型的部署,探讨了卷积层IP核的通用性设计.经实验验证,卷积层的时钟周期经优化后大大缩短,卷积层的设计可通过参数调整实现复用.部署于FPGA的卷积神经网络模型性能良好,能通过参数传输的方式实现针对不同数据的通用.
文献关键词:
人工智能;卷积神经网络;现场可编程逻辑门阵列;数字识别;TensorFlow
中图分类号:
作者姓名:
潘坤榕;夏福源;李瑞民;刘子嫣;唐珂;孙科学
作者机构:
南京邮电大学 电子与光学工程学院、微电子学院,江苏 南京 210023;南京邮电大学 贝尔英才学院,江苏 南京 210023;射频集成与微组装技术国家地方联合工程实验室,江苏 南京 210023
文献出处:
引用格式:
[1]潘坤榕;夏福源;李瑞民;刘子嫣;唐珂;孙科学-.基于FPGA的高效卷积神经网络设计)[J].计算机技术与发展,2022(07):105-110
A类:
B类:
FPGA,网络设计,特征提取能力,计算机视觉,自然语言处理,计算量,硬件平台,CPU,受限于,GPU,功耗,移动设备,ASIC,开发周期,难以实现,复用,现场可编程逻辑门阵列,计算力,并行化,卷积神经网络模型,MINST,VIVADO,HLS,卷积层,通用性,时钟,大大缩短,参数调整,模型性能,参数传输,数字识别,TensorFlow
AB值:
0.317324
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。