首站-论文投稿智能助手
典型文献
面向人脸检测MTCNN网络的加速硬件设计
文献摘要:
为加快深度学习人脸检测算法MTCNN(multi-task convolution neural network)的推理速度,满足许多应用场合检测的实时性的要求,基于Xilinx FPGA ZCU102开发板设计针对MTCNN专门优化的卷积和全连接加速硬件.该加速硬件不仅适用于MTCNN网络,其它神经网络推理算法也可以使用.针对算法特点,硬件采用小而多的计算核心,支持动态分块、图像间混合计算、片上多核共享RAM等完全自主开发的软硬件协同技术.在100 MHZ的频率下对MTCNN应用在加速器上的加速效果进行测试并和ARM程序进行对比,可以得到加速器相对于ARM O2速度加快了6倍多.
文献关键词:
多任务卷积神经网络;卷积;全连接;加速硬件;人脸检测;软硬件协同
作者姓名:
孙庆斌;何虎
作者机构:
清华大学 微电子学研究所,北京 100084
引用格式:
[1]孙庆斌;何虎-.面向人脸检测MTCNN网络的加速硬件设计)[J].计算机工程与设计,2022(02):370-375
A类:
MHZ
B类:
人脸检测,MTCNN,加速硬件,硬件设计,检测算法,multi,task,convolution,neural,network,推理速度,多应用,应用场合,Xilinx,FPGA,ZCU102,开发板,全连接,理算,法特,分块,混合计算,多核,RAM,自主开发,软硬件协同,协同技术,加速器,速效,ARM,O2,多任务卷积神经网络
AB值:
0.438843
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。