logo好方法网

一种基于密集卷积网络的低开销生活垃圾分类方法


技术摘要:
本发明公开了一种基于密集卷积网络的低开销生活垃圾分类方法,包括(1)、数据预处理,(2)、搭建密集卷积网络,(3)、将数据集划分为训练集、验证集和测试集,(4)、训练过程中,选用合适优化器和损失函数,设定超参数,评价指标为准确率。本发明在输入数据的预处理中进行  全部
背景技术:
目前的垃圾分类识别方法大多为迁移权重及网络结构模型进而进行微调。但现有 的迁移学习垃圾分类方法更侧重于性能的提升,往往忽略了模型的可移植性(低开销特 点)。深而复杂的网络虽然提升了性能,但也带来了模型体积庞大的缺点,例如VGG网络模型 文件大小为500M、Densenet-121模型文件大小为32M,在目前的嵌入式平台:如STM32系列大 多只有1M的存储空间,虽然可以做到模型压缩后嵌入,但资源仍然十分有限,因此无法将模 型植入到嵌入式平台中,给推广带来了难题;简单的浅层网络虽然体积小、可植入,但是其 泛化能力不强,识别准确度有待提升。因此,如何在降低占用硬件开销的基础上有效的保证 识别的精度是当下研究的重点。
技术实现要素:
本发明的目的在于提供一种基于密集卷积网络的低开销生活垃圾分类方法,解决 现有技术中生活垃圾分类方法的网络结构模型资源有限,无法将模型植入到嵌入式平台 中,给推广带来了难题;以及简单的浅层网络泛化能力不强,识别准确度低的技术问题。 为了解决上述技术问题,本发明采用技术方案实现: 一种基于密集卷积网络的低开销生活垃圾分类方法,包括如下步骤: (1)、数据预处理:获取开源垃圾分类数据集,下载网址为:https://github.com/ garythung/trashnet,该数据集中包括6种类别垃圾的N张图片,然后对N张图片分别进行水 平翻转、垂直翻转和旋转角度三种方式预处理,使得该数据集的样本量扩充至4N张,N为正 整数,N≥1000; (2)、搭建密集卷积网络:密集卷积网络由两个子网络构成,分别为密集卷积块和 连接两个密集块的过渡块;其中,一个密集卷积块包括十个卷积块;本次密集卷积块的输出 与上一个卷积块的输出用Concatenate层相连接并作为下一卷积块的输入,以此类推;通过 最后的过渡块输出连接两层全连接层,其中,最后一个全连接层输出向量维度为类别数,并 使用Softmax激活函数; (3)、将数据集划分为训练集、验证集和测试集:训练集作为输入送入网络进行训 练;验证集在每个Epoch运行后对本次训练进行验证;测试集作为测试样本,待模型训练完 毕后用来评估模型性能; (4)、训练过程中,选用合适优化器和损失函数,设定超参数,评价指标为准确率, 将训练完成后的模型保存为.h5文件,并对模型进行评估。 进一步改进,所述卷积块包括BatchNormalization层、Activation层、Conv2D层和 Dropout层;过渡块包括BatchNormalization层、Conv2D层和AveragePooling2D。 3 CN 111553426 A 说 明 书 2/4 页 进一步改进,步骤(2)之前还包括对4N张图片进行操作:使用cv2.Canny方法对之 前的4N张图片进行边缘提取,具体边缘提取的步骤包括: 1)、使用高斯滤波器滤波,去除噪点; 2)、使用sobel算子,计算每个点的梯度大小和梯度方向; 3)、使用非极大值抑制,消除边缘检测带来的杂散效应; 4)、采用双阈值,来确定真实和潜在的边缘; 经过边缘提取后,数据集的样本量扩充至8N张。 进一步改进,在作为输入送入网络前,使用Numpy工具包的vstack方法将RGB三通 道图片和边缘提取后单通道图片进行矩阵融合,将此矩阵作为输入。 进一步改进,所述6种垃圾包括硬纸板、玻璃瓶、金属罐、纸张、塑料和其他垃圾。 进一步改进,所述步骤(1)对N张图片进行预处理的方法包括用PIL的Image模块双 线性插值方法将其全部图片缩放为224×224大小,然后将缩放后的数据集图片使用Image 模块的rotate方法进行指定角度的逆时针旋转并另存为,使用FLIP_TOP_BOTTOM方法将图 片垂直翻转并另存为,使用FLIP_LEFT_RIGHT方法将图片水平翻转并另存为。 进一步改进,所述密集卷积网络以卷积神经网络为核心,选择Tensorflow-gpu  2.1.0深度学习框架和Keras-gpu  2.3.1深度学习库搭建网络,代码环境为Python3.6。 本发明技术方案的有益效果: 本发明的技术方案与现有的垃圾分类模型相比,在输入数据的预处理中进行了优 化,将三通道彩色图和边缘检测图进行矩阵融合,以此来作为模型的输入,加强特征信息; 受Densenet网络启发,对密集卷积网络结构进行搭建,并加入了Dropout层,并且利用学习 率自调节和调整超参数的方法,一方面使模型具有足够的特征提取能力,利用自身的特征 映射作为后续层的输入,减缓了深层网络带来的梯度消失问题,另一方面保证了模型的体 积可导入嵌入式平台,在低开销和高精度上实现了较好平衡,实现了90.8%的精度以及 5.08M的文件大小。 附图说明 图1是本发明的神经网络结构示意图。 图2是一个三层的密集块结构连接示意图。 图3是本发明的过渡块结构 图4是本发明的卷积块结构图。 图5是本发明训练过程的准确度曲线。 图6是本发明模型在预测集上的预测混淆矩阵。
分享到:
收藏