基于误差限制的神经网络混合精度量化方法|李奕铎;郭子博;刘凯;孙逍遥 - 期刊导航|首站-论文投稿智能助手|论文发表|论文智能投稿|期刊自助发表推荐|杂志社快速发表|查同导刊-域田数据官方网站

典型文献

基于误差限制的神经网络混合精度量化方法

文献摘要：

基于卷积神经网络的深度学习算法展现出卓越性能的同时也带来了冗杂的数据量和计算量，大量的存储与计算开销也成了该类算法在硬件平台部署过程中的最大阻碍。而神经网络模型量化使用低精度定点数代替原始模型中的高精度浮点数，在损失较小精度的前提下可有效压缩模型大小，减少硬件资源开销，提高模型推理速度。现有的量化方法大多将模型各层数据量化至相同精度，混合精度量化则根据不同层的数据分布设置不同的量化精度，旨在相同压缩比下达到更高的模型准确率，但寻找合适的混合精度量化策略仍十分困难。因此，提出一种基于误差限制的混合精度量化策略，通过对神经网络卷积层中的放缩因子进行统一等比限制，确定各层的量化精度，并使用截断方法线性量化权重和激活至低精度定点数，在相同压缩比下，相比统一精度量化方法有更高的准确率。其次，将卷积神经网络的经典目标检测算法YOLOV5s作为基准模型，测试了方法的效果。在COCO数据集和VOC数据集上，该方法与统一精度量化相比，压缩到5位的模型平均精度均值（mean Average Precision, mAP）分别提高了6%和24.9%。

文献关键词：

深度学习;混合精度;截断量化;YOLOV5

中图分类号：

[1] 自动化技术、计算机技术（TP） / 计算技术、计算机技术（TP3） / 计算机的应用（TP39） / 信息处理(信息加工)（TP391） / 模式识别与装置（TP391.4）

[2] 自动化技术、计算机技术（TP） / 自动化基础理论（TP1） / 人工智能理论（TP18）

[3] 自动化技术、计算机技术（TP） / 自动化基础理论（TP1） / 人工智能理论（TP18） / 自动推理、机器学习（TP181）

作者姓名：

李奕铎;郭子博;刘凯;孙逍遥

作者机构：

西安电子科技大学计算机科学与技术学院，陕西西安 710071

文献出处：

红外与激光工程

引用格式：

[1]李奕铎;郭子博;刘凯;孙逍遥-.基于误差限制的神经网络混合精度量化方法)[J].红外与激光工程,2022(04):

A类：

混合精度量化,截断量化

B类：

量化方法,深度学习算法,卓越性,冗杂,计算量,计算开销,硬件平台,平台部署,模型量化,低精度,定点数,数代,浮点数,压缩模型,硬件资源,模型推理,推理速度,层数,数据量化,数据分布,布设,压缩比,下达,模型准确率,十分困难,卷积层,放缩,截断方法,法线,目标检测算法,YOLOV5s,COCO,VOC,缩到,模型平均,平均精度均值,mean,Average,Precision,mAP

AB值：

0.389711

相似文献

一种用于红外目标检测的高效流水线式FPGA加速器

陈少毅;汤心溢;王健;黄静思;李争-上海科技大学,上海201210;中国科学院上海技术物理研究所,上海200083;中国科学院大学,北京100049;中国科学院红外探测与成像技术重点实验室,上海200083

基于深度特征融合的癌症病理图像分割网络

黄鸿;王涛;李远;周凡琳;李昱-重庆大学光电技术与系统教育部重点实验室,重庆 400044;重庆大学附属肿瘤医院病理科,重庆 400030

融合角度特征的CNN可见光室内定位算法

杨薇;邵建华;杜聪-南京师范大学计算机与电子信息学院,南京 210023;江苏省光电重点实验室,南京 210023

基于快速双分支密集连接网络和双注意力机制的高光谱图像分类

杨国亮;龚家仁;习浩;李世聪;邹俊峰-江西理工大学电气工程与自动化学院,江西赣州341000

基于双重注意力机制的CycleGAN海岸线自动提取方法