
技术摘要:
本发明提供了一种网络自适应半精度量化的图像处理方法和系统,包括:采集边缘计算设备的图像数据;将图像数据输入到预先建立的用于图像处理的深度残差卷积量化网络进行处理,得到图像数据对应的目标的类别、定位和图像中像素的类别;其中,深度残差卷积量化网络是基于 全部
背景技术:
随着深度学习的发展,卷积神经网络在目标检测领域得到了广泛的应用。为了保 证目标检测的准确性,基于卷积神经网络的目标检测模型越来越复杂,使得模型的参数量 呈指数级增长,不仅增大了模型存储空间,计算成本也相应的提高。这使得目前的高精度目 标检测模型无法在资源受限的边缘设备上部署。而量化方法可以将深度学习模型使用的32 位单精度浮点数运算转换为低比特深度的数值类型,可以大大降低模型计算资源。 目前常见的量化方法有二值量化、三值量化等。论文“Binarized Neural Networks”提出的二值化网络,把网络的权重、激活值量化为-1或者 1,使用一个位宽表示, 相对于32位浮点数网络,二值化可以节约32倍存储,并且可以使得整个网络的浮点数乘加 运算可以转换成浮点数加减法运算。但是该方法使得网络的表达能力变弱,即便只是对复 杂的分类任务,性能也会下降很多,无法适用于更加复杂的检测模型。论文“Trained Ternary Quantization”则是一个典型的三值量化方法,该方法并不是简单的将参数量化 0, 1,-1,而是通过学习的方式将每一层量化为不同的参数,尽管一定程度上避免的性能损 失,但是该方法仅量化权值,不对激活值进行量化,并且依然用32位浮点数表示量化参数, 同样不适合在边缘设备上进行部署使用。另外,还有一些后训练量化算法,将模型参数直接 进行量化进行推理,尽管这种方法实现简单,但是没有重新训练网络去学习修正量化带来 的误差,使得性能损失更大。
技术实现要素:
为克服上述现有技术的不足,本发明提出一种网络自适应半精度量化的图像处理 方法,其改进之处在于,包括: 采集边缘计算设备的图像数据; 将所述图像数据输入到预先建立的用于图像处理的深度残差卷积量化网络进行 处理,得到所述图像数据对应的目标的类别、定位和图像中像素的类别; 其中,所述的深度残差卷积量化网络是基于深度网络自适应半精度量化方法训练 得到的,所述半精度量化为采用一半位数的浮点数进行量化。 优选的,所述深度残差卷积量化网络的建立,包括: 第一步:基于完成识别的图像数据以及对应图像数据的目标的类别、定位和图像 中像素的类别得到训练数据集,基于训练数据集,采用深度残差卷积网络进行初步迭代训 练,得到所述深度残差卷积量化网络中各卷积层权值的初始值; 第二步:基于所述训练数据集中的图像数据,并对所述深度残差卷网络的每一个 卷积层的权值进行分组半精度量化以及对每一个卷积层输出的激活值进行分组半精度量 5 CN 111582229 A 说 明 书 2/8 页 化,进行前向传播得到当前深度残差卷积网络的输出的目标的类别、定位和图像中像素的 类别; 第三步:对比所述输出的目标的类别、定位和图像中像素的类别和对应所述图像 数据的目标的类别、定位和图像中像素的类别,得到输出误差,并基于所述输出误差对所述 深度残差卷积网络进行反向传播计算梯度值,根据所述梯度值更新半精度量化前的卷积层 权值; 第四步:判断所述深度残差卷积网络是否收敛;若是,则结束,得到完成训练的深 度残差卷积量化网络,否则,转入第二步,直至所述深度残差卷积网络收敛。 优选的,所述基于所述训练数据集中的图像数据,并对所述深度残差卷网络的每 一个卷积层的权值进行分组半精度量化以及对每一个卷积层输出的激活值进行分组半精 度量化,进行前向传播得到当前深度残差卷积网络的输出的目标的类别、定位和图像中像 素的类别,包括: 依次针对所述深度残差卷网络的从第一层开始的各卷积层,对所述卷积层的权值 进行分组半精度量化,根据所述卷积层的输入值和半精度量化后的权值进行卷积运算得到 所述卷积层的激活值; 对所述卷积层的激活值进行分组半精度量化,得到所述卷积层的输出值; 其中,第一层卷积层的输入值为所述训练数据集中的图像数据,其他各层卷积层 的输入值为上一层卷积层的输出值;最后一层卷积层的输出值为目标的类别、定位和图像 中像素的类别。 优选的,所述卷积层各组权值的量化公式如下: 式中, 表示第i组权值的量化输出,wi表示第i组权值, 表示第i组权值的下阈 值, 表示i组权值的上阈值,Nw表示权值分组数量, 表示将第i组权值限 制到该组上阈值和该组下阈值之间; 表示第i组权值的缩放因子; 的取值如下式所示: 的计算式如下: 式中,αl表示权值下阈值尺度因子, 表示第i组权值的最小值; 的计算式如下: 式中,αt表示权值上阈值尺度因子, 表示第i组权值的最大值。 6 CN 111582229 A 说 明 书 3/8 页 优选的,所述第i组权值的缩放因子 的计算式如下: 优选的,所述权值量化级别n 设置为216w 。 优选的,所述卷积层输出的激活值的量化公式如下: 式中, 表示第i组激活值的量化输出,ai表示第i组激活值, 表示第i组激活值 的下阈值, 表示i组激活值的上阈值,该阈值范围通过指数移动平均值在训练中统计得 到,Na表示激活值分组数量, 表示将第i组激活值限制到该组上阈值和该组 下阈值之间; 表示第i组激活值的缩放因子; 的取值如下式所示: 优选的,所述第i组激活值的缩放因子 的计算式如下: 式中,na为表示量化级别的常数。 优选的,所述权值量化级别n 设置为216a 。 基于同一发明构思,本申请还提供了一种网络自适应半精度量化的图像处理系 统,其特征在于,包括:数据获取模块和图像处理模块; 所述数据处理模块,用于采集边缘计算设备的图像数据; 所述图像处理模块,用于将所述图像数据输入到预先建立的用于图像处理的深度 残差卷积量化网络进行处理,得到所述图像数据对应的目标的类别、定位和图像中像素的 类别; 其中,所述的深度残差卷积量化网络是基于深度网络自适应半精度量化方法训练 得到的,所述半精度量化为采用一半位数的浮点数进行量化。 与最接近的现有技术相比,本发明具有的有益效果如下: 本发明提供了一种网络自适应半精度量化的图像处理方法和系统,包括:采集边 缘计算设备的图像数据;将图像数据输入到预先建立的用于图像处理的深度残差卷积量化 网络进行处理,得到图像数据对应的目标的类别、定位和图像中像素的类别;其中,深度残 差卷积量化网络是基于深度网络自适应半精度量化方法训练得到的,半精度量化为采用一 半位数的浮点数进行量化。本发明对深度残差卷积量化网络进行半精度自适应量化,能够 在保证精度的前提下,减少深度残差卷积量化网络的大小,降低计算资源要求。 7 CN 111582229 A 说 明 书 4/8 页 本发明针对深度残差卷积量化网络的权值和激活值进行半精度量化,减小了量化 误差,另外,根据分组的情况进行误差量化,可以使得量化更加的细粒度,最后,本发明在深 度残差卷积量化网络的训练过程中模拟了量化的过程,让深度残差卷积量化网络参数学习 去修正量化带来的误差,比训练后量化更准确。 附图说明 图1为本发明提供的一种网络自适应半精度量化的图像处理方法流程示意图; 图2为本发明提供的一个网络自适应半精度量化的图像处理方法实施例的流程示 意图; 图3为本发明的权值分组量化的一种结构示意图; 图4为本发明的权值分组量化的另一种结构示意图; 图5为本发明的权值分组量化的再一种结构示意图; 图6为本发明的激活值分组量化的一种结构示意图; 图7为本发明的激活值分组量化的另一种结构示意图; 图8为本发明提供的一种网络自适应半精度量化的图像处理系统基本结构示意 图; 图9为本发明提供的一种网络自适应半精度量化的图像处理系统详细结构示意 图。