首站-论文投稿智能助手
典型文献
KCPNet:张量分解的轻量卷积模块设计、部署与应用
文献摘要:
为解决现有卷积模块在实际应用中内存消耗高、计算效率低的问题,在Kronecker CANDE-COMP/PARAFAC(KCP)张量分解的基础上,提出一种轻量、高效、瓶颈结构的卷积模块(KCP-Net).对普通卷积作2阶KCP分解,生成的因子张量分别映射为两层负责输入输出通道变化的1×1卷积和两层负责特征提取的变通道可分离卷积,再将这4层卷积组成含有瓶颈结构的KCPNet卷积模块.基于OpenCL并行编程框架将KCPNet部署于嵌入式GPU,并围绕pico-flexx深度相机开发了动态手势识别应用.实验结果表明:在ImageNet大规模标准数据集上,相比ResNet、ResNeXt等已有的张量分解卷积模块,KCPNet在准确率相近的情况下能够兼顾空间和计算复杂度的效率;在中等规模标准数据集CIFAR-10上,KCPNet能够在无明显精度损失的前提下将传统的VGG模型压缩至原先的16.1% 并节约75.5% 的计算量;在面向嵌入式GPU时,并行部署的KCPNet可使CIFAR-10的识别速度达到100帧/s.以KCPNet为核心开发的手势识别应用程序可达到99.5% 的准确率和100帧/s以上的运行速度,内存开销为22 M B.
文献关键词:
张量分解;Kronecker CANDECOMP/PARAFAC张量分解;轻量卷积模块;并行部署;手势识别
作者姓名:
王鼎衡;赵广社;姚满;李国齐
作者机构:
西安交通大学自动化科学与工程学院, 710049 ,西安;清华大学精密仪器系, 100084 ,北京
引用格式:
[1]王鼎衡;赵广社;姚满;李国齐-.KCPNet:张量分解的轻量卷积模块设计、部署与应用)[J].西安交通大学学报,2022(03):135-146
A类:
KCPNet,轻量卷积模块,CANDE,flexx,并行部署,CANDECOMP
B类:
张量分解,模块设计,部署与应用,计算效率,Kronecker,PARAFAC,瓶颈结构,两层,输入输出,变通,可分离卷积,OpenCL,编程框架,GPU,pico,深度相机,动态手势识别,ImageNet,标准数据集,ResNet,ResNeXt,分解卷积,计算复杂度,CIFAR,精度损失,VGG,模型压缩,原先,计算量,应用程序,运行速度,开销
AB值:
0.261979
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。