logo好方法网

一种基于特征动态选择的多任务联合检测方法


技术摘要:
本发明公开了一种基于特征动态选择的多任务联合检测方法,属于图像处理技术领域。大多数现有的检测模型都是每个不同的任务独立设计一个不同的模型来分别进行处理,需要花费大量的人工精力。本发明创造性地提出一种基于特征动态选择的多任务联合检测模型,该模型能够根  全部
背景技术:
显著性物体检测、边缘检测和骨架检测这三类问题在图像处理技术领域有着重要 的研究和应用价值,例如在无人驾驶、机器人导航、目标分割等众多高科技领域均发挥着不 可替代的作用。之前的大部分方法都是针对上述问题中的某一个特定问题而专门设计一个 深度网络结构,独立地完成这三类检测任务,并且对应于某一类的任务的方法不能在其它 类型的方法上发挥效果,这极大提高了此类方法的研发和应用成本,降低了实际应用意义。 对于显著性物体检测,Xi  Li等人于2016年提出的方法“Li  X ,Zhao  L ,Wei  L ,et  al .DeepSaliency:Multi-task  deep  neural  network  model  for  salient  object  detection[J].IEEE  Transactions  on  Image  Processing,2016,25(8):3919-3930.”采用 了一种多任务监督的深度网络结构来解决此任务。此方法对深度网络结构进行了大幅修 改,且只能应用于显著性物体检测;对于边缘检测,Saining  Xie等人于2015年提出了“Xie  S ,Tu  Z .Holistically-nested  edge  detection[C]//Proceedings  of  the  IEEE  international  conference  on  computer  vision.2015:1395-1403.”方法,此方法在深度 网络结构中的每一层都加上强监督,一次来得到更精细的边缘信息;对于骨架提取,Wei  Ke 等人于2017年提出了“Ke  W,Chen  J,Jiao  J,et  al.SRN:Side-output  Residual  Network  for  Object  Symmetry  Detection  in  the  Wild[J].arXiv  preprint  arXiv:1703.02243, 2017.”,此方法对深度网络结构的多个侧输出上进行了监督学习,并加入了跳层连接来适 应骨架提取任务。 上述三种方法都是针对特定的问题而分别设计了一种复杂的网络结构以专门解 决此类问题,这些网络结构并不能够被运用到其他类别的任务,研究投入巨大的同时实际 使用成本也较高。 此外,名称为“基于新型神经网络的多任务场景语义理解模型及其应用”的 201710453745.7号专利申请中提出的网络模型的应用场景为富含具体物体类别信息的语 义分割任务,不适合解决一些不关注物体类别信息的低层计算机视觉任务。 名称为“一种基于深度神经网络的多任务语音分类方法”的201710801016.6号专 利申请中的多任务方法的领域为语音处理,数据输入类型为一维语音信息,不能解决二维 图像信息相关的问题。
技术实现要素:
本发明需要解决的技术问题是,针对已有的显著性物体检测方法、边缘检测方法 以及骨架检测方法分别需要设计三种不同的模型,且这三种模型之间的差异明显,因此不 能够被运用到其他类别检测任务的问题。这些限制提高了深度网络的应用要求和难度。为 3 CN 111598107 A 说 明 书 2/5 页 此提出了一种基于特征动态选择的多任务联合检测方法,该方法开发了一种新的统一的深 度网络模型,能够同时实现显著性物体检测、边缘检测和骨架检测三种不同类别的图像检 测功能。这样一个统一的深度网络模型能够大大减少深度网络的推广和量产成本。 本发明的采用的技术方案是: 一种基于特征动态选择的多任务联合检测方法,该方法能够根据不同任务的特点 自适应且动态地从共享的特征集合中选择各任务所需的特征,端到端的完成训练并通过一 次计算同时输出得到待检测图像的显著性物体检测结果图像、边缘检测结果图像以及骨架 检测结果图像,具体包含如下步骤: 第1步、利用任一一个已知架构的CNN网络,输入待检测的RGB图像并提取5个不同 层级的特征集合; 第2步、将第1步提取得到的5个不同层级的特征集合进行合并(concatenate)操 作,然后将合并后的特征分别插值为具有4个不同下采样率尺寸的特征集合; 第3步、将第2步得到的4个不同下采样率尺寸的特征集合分别经过一个特征动态 选择模块后获得适合各个待解决任务的选择性融合后的特征:包括待检测图像的显著性物 体检测、边缘检测以及骨架检测共3个待解决任务,每个任务各4个不同下采样率尺寸的特 征集合; 所述的特征动态选择模块包括一个共享的全局池化操作和3个独立的全连接操 作; 第4步、对于每个任务,分别将第3步得到的该任务的4个不同下采样率尺寸的特征 集合上采样到原输入图像的尺寸,再进行像素级别的相加,并经过一个卷积层后生成对应 任务最终的预测结果图。 本发明的有益效果为:本发明通过动态选择共享特征集合中的特征并加以组合, 能够极大减少监测模型的参数量并兼顾各个任务的特点。通过多任务协同学习也可以达到 对各检测任务的学习起到相互促进的作用。本方法通过将特征动态选择这一学习策略广泛 地结合到原有的检测模型中,在减少检测模型参数量的同时提升了检测速度,并且保持了 各任务良好的检测效果。以多任务协同学习的形式,本方法能够同时完成显著性物体检测、 边缘检测和骨架检测三种不同的任务,并且保证了三种检测任务的良好检测效果。在拥有 单个NVIDIA  RTX2080Ti显卡的服务器上,本方法可以以约40FPS的速度运行。 附图说明 图1为基于特征动态选择的多任务联合检测方法的流程图。 图2为基于特征动态选择的多任务联合检测方法的一个实施方案的整体结构示意 图。 图3为基于特征动态选择的多任务联合检测方法的一个实施方案的特征动态选择 模块结构示意图。 图4为基于特征动态选择的多任务联合检测方法的一个实施方案的网络模型训练 过程示意图。 4 CN 111598107 A 说 明 书 3/5 页
分享到:
收藏