
技术摘要:
本发明公开了一种行人检测方法、装置、终端设备及存储介质,该方法包括:获取待检测图像;对所述待检测图像进行运动检测,得到所述待检测图像对应的运动区域掩膜;将所述待检测图像输入预先训练好的卷积神经网络,通过所述卷积神经网络按照所述运动区域掩膜,对所述待 全部
背景技术:
随着信息技术的发展,视频监控系统已经普遍存在于生活的各个角落。在视频监 控系统广泛使用的情况下,具有远探测范围的行人检测技术,能够检测到不同姿态下的人 体,能够对用户提供有效的人员警示信息。 目前,一般是通过利用卷积神经网络对整幅图像进行特征提取,再根据提取到的 特征图得到行人检测结果。 然而,发明人在实施本发明的过程中发现,由于卷积神经网络相对来说比较复杂, 从整幅图像中进行特征提取,特别是对于较大的图像来说,运算量较大,耗时较长,导致行 人检测的效率低。
技术实现要素:
本发明实施例提供一种行人检测方法、装置、终端设备及存储介质,能够准确、高 效地识别行人。 为了实现上述目的,本发明一实施例提供一种行人检测方法,包括: 获取待检测图像; 对所述待检测图像进行运动检测,得到所述待检测图像对应的运动区域掩膜; 将所述待检测图像输入预先训练好的卷积神经网络,通过所述卷积神经网络按照 所述运动区域掩膜,对所述待检测图像进行行人检测,得到所述待检测图像的行人目标框。 作为上述方案的改进,所述将所述待检测图像输入预先训练好的卷积神经网络, 通过所述卷积神经网络按照所述运动区域掩膜,对所述待检测图像进行行人检测,得到所 述待检测图像的行人目标框之后,还包括步骤: 对所述待检测图像的行人目标框进行筛选,得到最终目标框。 作为上述方案的改进,所述将所述待检测图像输入预先训练好的卷积神经网络, 通过所述卷积神经网络按照所述运动区域掩膜,对所述待检测图像进行行人检测,得到所 述待检测图像的行人目标框,具体包括: 将所述待检测图像输入预先训练好的卷积神经网络; 通过所述卷积神经网络的各卷积层,根据所述运动区域掩膜对所述待检测图像进 行特征提取,得到所述待检测图像在各卷积层提取出的输出特征图; 通过所述卷积神经网络的全连接层,根据所述各卷积层提取出的输出特征图进行 行人目标类别和坐标的预测,得到所述待检测图像的行人目标框。 作为上述方案的改进,所述通过所述卷积神经网络的各卷积层,根据所述运动区 域掩膜对所述待检测图像进行特征提取,得到所述待检测图像在各卷积层提取出的输出特 4 CN 111582032 A 说 明 书 2/9 页 征图,具体包括: 根据所述运动区域掩膜,确定所述卷积神经网络中各卷积层的输入图像的待卷积 区域; 通过所述卷积神经网络的各卷积层,根据各卷积层的输入图像的待卷积区域,对 各卷积层的输入图像进行卷积处理,获得各卷积层的输出特征图;其中,所述待检测图像是 所述卷积神经网络的第一个卷积层的输入图像。 作为上述方案的改进,所述根据所述运动区域掩膜,确定所述卷积神经网络中各 卷积层的输入图像的待卷积区域,具体包括: 将所述运动区域掩膜的大小,缩放至与所述卷积神经网络的各卷积层的输入图像 的大小相等,得到各卷积层的第一掩膜; 根据各卷积层的第一掩膜和各卷积层的感受野,确定各卷积层的输入图像的待卷 积区域。 作为上述方案的改进,所述根据各卷积层的第一掩膜和各卷积层的感受野,确定 各卷积层的输入图像的待卷积区域,具体包括: 根据各卷积层的感受野,对各卷积层的第一掩膜进行膨胀处理,得到各卷积层的 第二掩膜; 根据各卷积层的第二掩膜,确定各卷积层的输入图像的待卷积区域。 作为上述方案的改进,所述通过所述卷积神经网络的各卷积层,根据各卷积层的 输入图像的待卷积区域,对各卷积层的输入图像进行卷积处理,获得各卷积层的输出特征 图,具体包括: 通过所述卷积神经网络的各卷积层,对各卷积层的输入图像的待卷积区域进行卷 积处理,得到各卷积层的输入图像的待卷积区域对应的特征值,并将各卷积层的输入图像 的待卷积区域对应的特征值赋予至各卷积层的输出特征图的对应节点中; 根据预先得到的各卷积层的参考特征图,对各卷积层的输出特征图中未赋值的节 点进行赋值,得到各卷积层的输出特征图。 本发明另一实施例对应提供了一种行人检测装置,包括: 待检测图像获取模块,用于获取待检测图像; 运动区域掩膜获取模块,用于对所述待检测图像进行运动检测,得到所述待检测 图像对应的运动区域掩膜; 行人检测结果获取模块,用于将所述待检测图像输入预先训练好的卷积神经网 络,通过所述卷积神经网络按照所述运动区域掩膜,对所述待检测图像进行行人检测,得到 所述待检测图像的行人目标框。 本发明另一实施例提供了一种终端设备,包括处理器、存储器以及存储在所述存 储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实 现如上任意一项所述的行人检测方法。 本发明另一实施例提供了一种计算机可读存储介质,所述计算机可读存储介质包 括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在 设备执行如上任意一项所述的行人检测方法。 与现有技术相比,本发明实施例提供的一种行人检测方法、装置、终端设备及存储 5 CN 111582032 A 说 明 书 3/9 页 介质,通过对获取到的待检测图像进行运动检测,得到所述待检测图像对应的运动区域掩 膜,再将所述待检测图像输入预先训练好的卷积神经网络,通过所述卷积神经网络按照所 述运动区域掩膜,对所述待检测图像进行行人检测,得到所述待检测图像的行人目标框,从 而实现行人检测。本发明实施例在进行行人检测的过程中,由于是通过卷积神经网络按照 运动区域掩膜对待检测图像进行特征提取,无需对整幅待检测图像进行特征提取,因此能 够减少特征提取过程的运算量,减少特征提取所需要的时间,从而解决了现有技术中由于 从整幅图像中进行特征提取而导致的运算量大、耗时长的问题,并且,运动区域掩膜能够反 映待检测图像中的运动区域信息,利用运动区域掩膜结合卷积神经网络进行行人检测,能 够保证行人检测的准确性,因此能够准确、高效地识别行人。 附图说明 图1是本发明一实施例提供的一种行人检测方法的流程示意图。 图2是本发明另一实施例提供的一种行人检测方法的流程示意图。 图3是本发明一实施例提供的一种YOLO网络的结构示意图。 图4(a)是本发明一实施例提供的划分网格并标记运动区域后的待检测图像的示 意图。 图4(b)是本发明一实施例提供的待检测图像的第一掩膜的示意图。 图5是本发明一实施例提供的一种行人检测装置的结构示意图。 图6是本发明一实施例提供的一种终端设备的结构示意图。