logo好方法网

基于丰富鲁棒卷积特征模型的复杂纹理小缺陷的分割方法


技术摘要:
本发明公开了一种基于丰富鲁棒卷积特征模型的复杂纹理小缺陷的分割方法,其特征在于,该方法包括获取含有待分割对象的图像,并利用丰富鲁棒卷积特征模型对含有待分割对象的图像进行特征重组,获得每个侧输出层的特征图;每个侧输出层的特征图依次连接一个反卷积层和一  全部
背景技术:
锂电池表面缺陷检测已经成为锂电池表面质量控制的重要技术手段,锂电池表面 质量不仅可以提升电池组件的使用寿命,也可以提高锂电池的发电效率。 对于基于卷积神经网络(CNN)的裂纹分割方法通常面临着两个问题,其一是裂纹 的漏检或误检严重,其二是预测的裂纹分割结果较粗,需要复杂的后期处理才能获得精细 裂纹。锂电池表面具有复杂的非均匀纹理背景是产生上述问题的主要原因之一,另一个原 因是缺陷图像中裂纹像素与背景像素的占比极度不均衡,例如缺陷图像尺寸为100万像素, 而缺陷像素只占几十个像素甚至十几个像素。 通过不同的卷积层获得的信息随层数变深而变得更粗糙,更具备“全局性”,低层 卷积层包含了复杂的随机纹理背景和目标细节信息,对于目标信息和背景的区分尚不明 显,网络学习到的只是一些形状、边角特征等不具有区分性的信息,在更高层卷积层中重要 的目标信息被保留下来,而中间卷积层则包含了必不可少的目标细节信息。但是,一般的卷 积神经网络模型仅使用最后一个卷积层或各个阶段池化层之前的卷积层的输出特征,忽视 了中间卷积层包含的目标细节信息;而对于裂纹分割来说,其面临的关键性问题就是背景 和目标信息的相似度很高,过度的融合势必造成误检严重。 尽管基于卷积神经网络的分割方法擅长预测出富含语义信息的轮廓、边缘等特 征,但是通过分析可知直接采用基于卷积神经网络进行裂纹分割的预测结果比真实标签的 标注裂纹粗得多,导致不能精确地定位裂纹像素。现有文献中很少讨论预测裂纹、边缘、轮 廓或者线条过粗的问题,一个可能的原因是这些方法通常会在生成初始预测结果后应用使 裂纹、边缘、轮廓或者线条细化的后期处理方法来获得接近真实标签的预测结果,使得处理 后的预测结果的宽度对结果看似没有什么影响,实际会降低预测的精度,因此在一些对像 素级的精确定位有着较高要求的检测任务中,不能满足需求。 损失函数是用来评估模型的预测值与真实值之间不一致的程度,损失函数越小, 代表模型的鲁棒性越好,损失函数能指导模型学习。而锂电池裂纹缺陷图像由于裂纹像素 与背景像素占比极度不均衡,导致负样本(背景像素)占有模型损失的很大一部分比重,这 会使学习过程陷入损失函数的局部最小值,造成预测更偏向于背景像素,训练出的模型也 无法检测出裂纹这一“不容易发生的事件”,因此锂电池裂纹缺陷图像中裂纹像素与背景像 素占比不均衡对损失函数产生的影响,是导致裂纹分割结果较粗的根本原因。
技术实现要素:
针对现有技术的不足,本发明拟解决的技术问题是,提供一种基于丰富鲁棒卷积 特征模型的复杂纹理小缺陷的分割方法。 5 CN 111598854 A 说 明 书 2/12 页 本发明解决所述技术问题采用的技术方案是: 一种基于丰富鲁棒卷积特征模型的复杂纹理小缺陷的分割方法,其特征在于,该 方法包括获取含有待分割对象的图像,并利用丰富鲁棒卷积特征模型对含有待分割对象的 图像进行特征重组,获得每个侧输出层的特征图;每个侧输出层的特征图依次连接一个反 卷积层和一个侧输出层精细损失函数,得到每个阶段侧输出层的预测特征图; 同时在模型中添加一个融合层,将所有侧输出层特征图反卷积后的特征图融合在 一起,然后连接一个融合层精细损失函数获得最终预测图,实现缺陷分割; 其中,侧输出层精细损失函数,满足公式(1): Pside=σ(Aside),Aside={aj,j=1,……|Y|}              (2) 式中,L(k)(Pside,G)表示第k阶段的距离损失函数;L(W,w(k))表示第k阶段的加权交 叉熵损失函数;Pside表示第k阶段侧输出层的预测特征图;σ为sigmoid激活函数;Aside表示k 个阶段侧输出层的预测特征图所有像素处激活值的集合;aj表示第k阶段侧输出层的预测 特征图中的任一像素j处的激活值;Y表示图中缺陷像素和非缺陷像素之和; 融合层精细损失函数由下式得到: Lfuse(W,w)=Lc(Pfuse,G)                         (3) 式中,Lc表示标准的交叉熵损失函数;Pfuse表示k个阶段侧输出层的预测特征图的 融合,即融合层权重;K表示阶段总数; 使用argmin函数将融合层精细损失函数和所有阶段的侧输出层精细损失函数汇 总起来,得到目标函数L,用公式(5)表示; 最后优化目标函数,获得侧输出层精细损失函数以及融合层精细损失函数的权 重。 利用丰富鲁棒卷积特征模型进行特征重组的具体过程为: 在原始ResNet40网络的基础上去掉全连接层和第五阶段的池化层,原始ResNet40 网络第一阶段的标识块层以及第二阶段的标识块层分别侧向连接一个卷积层,得到第一、 二阶段侧输出层的特征图; 在原始ResNet40网络的第三、四、五阶段中的每个块层之后分别侧向连接一个卷 积层,得到各自块层卷积后的特征图,然后将同一阶段所有的块层卷积后的特征图分别进 行逐元素相加获得相应阶段侧输出层的特征图。 第一、二阶段的标识块层侧向连接的卷积层的卷积核大小1×1、步长和通道数均 为1;第三、四、五阶段中的每个块层后侧向连接的卷积层的卷积核大小为1×1、步长为1、通 道数为21。 所述原始ResNet40网络包括40个卷积层和位于网络最后一层的全连接层,分为5 个阶段,每个阶段均包含一个卷积块层和一个或多个标识块层,其中第一、二阶段分别包含 6 CN 111598854 A 说 明 书 3/12 页 一个含卷积块层和一个标识块层,第三、四、五阶段分别包含一个卷积块层和两个标识块 层,每个卷积块层和标识块层均包含多个卷积层;每个阶段在所有的标识块层之后均加入 一个池化窗口大小为2×2、步长为1的池化层。 原始ResNet40网络的具体结构为:首先输入的目标图像依次经过卷积核大小为5 ×5、步长为1、通道数为32的卷积和卷积核大小为2×2、步长为2的最大池化层后得到第一 阶段的输入特征;第一阶段的输入特征依次经过卷积核大小为1×1、3×3、1×1,步长均为 1、通道数均为32的三个卷积和一个卷积核大小为1×1、步长为1、通道数为32的残差连接后 得到第一阶段卷积块层的输出特征;第一阶段卷积块层的输出特征依次经过卷积核大小为 1×1、3×3、1×1,步长均为1、通道数均为32的三个卷积后得到第一阶段标识块层的输出特 征;第一阶段标识块层的输出特征经过一个卷积核大小为2×2、步长为2的池化层后得到第 一阶段的输出特征; 第一阶段的输出特征依次经过卷积核大小为1×1、3×3、1×1,步长均为1、通道数 为均为64的三个卷积和一个卷积核大小为1×1、步长为1、通道数为64的残差连接后得到第 二阶段卷积块层的输出特征;第二阶段卷积块层的输出特征依次经过卷积核大小为1×1、3 ×3、1×1,步长均为1、通道数均为64的三个卷积后得到第二阶段标识块层的输出特征;第 二阶段标识块层的输出特征经过一个卷积核大小为2×2、步长为2的池化层后得到第二阶 段的输出特征; 第二阶段的输出特征依次经过卷积核大小为1×1、3×3、1×1,步长均为1、通道数 为均为256的三个卷积和一个卷积核大小为1×1、步长为1、通道数为256的残差连接后得到 第三阶段卷积块层的输出特征;第三阶段卷积块层的输出特征依次经过卷积核大小为1× 1、3×3、1×1,步长均为1、通道数均为256的三个卷积后得到第三阶段第一标识块层的输出 特征;第三阶段第一标识块层的输出特征依次经过卷积核大小为1×1、3×3、1×1,步长均 为1、通道数均为256的三个卷积后得到第三阶段第二标识块层的输出特征;第三阶段第二 标识块层的输出特征经过一个卷积核大小为2×2、步长为2的池化层后得到第三阶段的输 出特征; 第四阶段的操作过程与第三阶段相同,第三阶段的输出特征重复第三阶段的操作 后得到第四阶段的输出特征; 第五阶段的操作过程与第四阶段的卷积块层和两个标识块层的操作过程相同,第 四阶段的输出特征重复第四阶段的卷积块层和两个标识块层的操作后得到第五阶段的输 出特征。 一种基于丰富鲁棒卷积特征模型的复杂纹理小缺陷的分割方法,该方法的具体步 骤是: S1图像预处理 采集含有待分割缺陷的图像,将采集的图像归一化处理为1024×1024像素;对归 一化处理后的图像添加像素级标签,这些添加了标签的图像即为目标图像;将目标图像按 照比例分为不同的样本集; S2构建丰富鲁棒卷积特征模型 以原始ResNet40网络为基础,在原始ResNet40网络第一阶段的标识块层以及第二 阶段的标识块层分别侧向连接一个卷积层,得到第一、二阶段侧输出层的特征图; 7 CN 111598854 A 说 明 书 4/12 页 在原始ResNet40网络的第三、四、五阶段中的每个块层之后分别侧向连接一个卷 积层,得到各自块层卷积后的特征图,然后将同一阶段所有的块层卷积后的特征图分别进 行逐元素相加获得相应阶段侧输出层的特征图; 将上述五个阶段侧输出层的特征图分别连接一个反卷积层(deconv)进行上采样, 得到各自阶段反卷积后的特征图,并将每个阶段反卷积后的特征图分别连接一个侧输出层 精细损失函数进行逐像素分类,得到每个阶段侧输出层的预测特征图; 将上述各个阶段反卷积后的特征图连接在一起,然后通过卷积核大小为1×1、步 长为1的卷积层融合所有反卷积后的特征图,得到融合层特征图;融合层特征图最后连接一 个融合层精细损失函数,得到最终预测特征图; S3模型训练与测试 初始化模型参数,输入训练用的目标图像及其对应的像素级标签;在模型训练过 程中通过随机梯度下降法将损失传递至每个卷积层的权重,并更新其权重值,随机梯度下 降法的动量为0.9,权重衰减为0.0005;每个训练过程中随机采样1张图像,迭代周期数达到 100周期时停止训练,完成模型的训练; 将测试用的目标图像缩放调整到1024x1024像素,并将缩放后的目标图像输入到 训练完成的模型中;单张图像测试时间为0.1s,重复模型的操作,完成模型测试。 所述待分割对象为裂纹、边缘或线状结构。 与现有技术相比,本发明的有益效果是: 本发明从卷积特征的合理利用和设计损失函数的角度出发,旨在使模型学习到尽 可能丰富完整的缺陷特征,并在不使用后期处理方法的情况下预测出具有鲁棒性的精细缺 陷,使模型学习到的缺陷特征能产生与真实标签尽可能相似的预测特征图;因此,本发明以 原始ResNet40网络为基础,构建了丰富鲁棒卷积特征模型,并在Keras1.13深度学习框架下 进行端到端的深度学习,该模型采用了多尺度和多等级特征的网络结构,更多的融合了高 层特征(第三、四、五阶段),而较少的融合低层(第一、二阶段)特征,同时在每个阶段分别采 用卷积核大小为1x1的卷积进行叠加融合,将所有卷积特征封装为更丰富更鲁棒的表达方 式,提高了特征的表达能力;而且利用了每个阶段中间层的输出特征图,克服了现有常规卷 积神经网络模型仅使用最后一个卷积层或各个阶段池化层之前的卷积层的输出特征的而 忽视中间层包含的目标细节信息的缺陷。 本发明针对裂纹像素和非裂纹像素之间占比不均衡导致的预测结果不准确的问 题,为预测出精细裂纹,分别在各个阶段的侧输出层引入了侧输出层精细损失函数,在模型 的融合层引入了融合层精细损失函数,侧输出层精细损失函数结合了加权交叉熵损失函数 和距离损失函数,精细侧输出层的预测特征图中的缺陷特征,同时在模型训练过程中通过 侧输出层精细损失函数优化侧输出层中各个卷积层的权重;融合层精细损失函数又融合了 侧输出层精细损失函数,精细最终预测特征图中的缺陷特征,同时在模型训练过程中通过 融合层精细损失函数优化融合层中各个卷积层的权重,实现了对裂纹从全局到局部的预 测。 从实验结果来看,相较于传统的滤波器分割方法和常规卷积神经网络,使用丰富 鲁棒卷积特征模型可以预测出更精细的裂纹,使裂纹分割识别准确率能达到79.64%。 本方法能为与裂纹结构类似的具有极度长宽比,且对精细性有较高要求的目标分 8 CN 111598854 A 说 明 书 5/12 页 割提供思路。 附图说明 图1为本发明的丰富鲁棒卷积特征模型的网络结构图; 图2为本发明的不同分割方法的裂纹分割结果图; 图3为本发明的不同分割方法的评估结果对比图。
分享到:
收藏