logo好方法网

人群密度图的获取方法、装置、计算机设备和存储介质


技术摘要:
本申请涉及一种人群密度图的获取方法、装置、计算机设备和存储介质。所述方法包括:获取待处理人群图像,所述待处理人群图像包括在人群密集的拥挤场景下拍摄的图像;将所述待处理人群图像输入至预设的密度图生成网络中,得到目标人群密度图;其中,所述密度图生成网络  全部
背景技术:
目前,对于上下班高峰期的地铁站或者节假日的旅游景点等其它人群密集的公共 场所的人群密度估计,在公共安全、拥堵避免、流量分析等方面具有广泛的应用,但是公共 场所中由于存在背景噪声、人与人之间的遮挡和人群分布的多样性等问题,导致很难生成 准确的人群密度图,因此如何生成准确的人群密度图成为当前亟需解决的问题之一。 传统技术中,使用基于特征回归的方法(比如利用深度神经网络做特征回归)生成 人群密度图,该方法通常聚焦在降低计数错误率上,也即通过考虑单个像素点的表面特征 识别对应像素中是否存在人头的方式来生成人群密度图。 然而,传统技术识别的人头中多了很多假点或者重复识别的人头,从而导致生成 的人群密度图的准确度不高。
技术实现要素:
基于此,有必要针对上述技术问题,提供一种能够提高人群密度图的准确度的人 群密度图的获取方法、装置、计算机设备和存储介质。 一种人群密度图的获取方法,所述方法包括: 获取待处理人群图像,所述待处理人群图像包括在人群密集的拥挤场景下拍摄的 图像; 将所述待处理人群图像输入至预设的密度图生成网络中,得到目标人群密度图; 其中,所述密度图生成网络为对标签密度图像和初始神经网络输出的预测人群密度图像进 行下采样处理,并根据下采样后的预测人群密度图像和下采样后的标签密度图像之间的损 失,对所述初始神经网络进行训练得到的网络。 在其中一个实施例中,还包括: 获取训练样本图像; 将所述训练样本图像输入至初始神经网络中,得到预测人群密度图像; 对所述预测人群密度图像和对应的标签密度图像分别进行至少两次下采样处理, 得到每次下采样后的预测人群密度图像和对应下采样后的标签密度图像; 根据所述每次下采样后的预测人群密度图像和对应下采样后的标签密度图像之 间的损失,调整所述初始神经网络的参数,得到所述密度图生成网络。 在其中一个实施例中,还包括: 针对每次下采样处理,计算下采样后的预测人群密度图像和对应下采样后的标签 密度图像之间的图像损失值; 根据所述至少两次下采样处理对应的所有图像损失值,调整所述初始神经网络的 4 CN 111582252 A 说 明 书 2/14 页 参数,得到所述密度图生成网络。 在其中一个实施例中,还包括: 计算所述预测人群密度图像和对应的标签密度图像之间的像素损失值; 根据所述像素损失值以及所述至少两次下采样处理对应的所有图像损失值,得到 总损失值; 根据所述总损失值调整所述初始神经网络的参数,直至所述总损失值达到预设的 标准值,将达到标准值的总损失值对应的初始神经网络作为所述密度图生成网络。 在其中一个实施例中,还包括: 采用预设的空间关联损失函数计算所述预测人群密度图像和对应的标签密度图 像之间的像素损失值;其中,所述空间关联损失函数用于获取所述预测人群密度图像和对 应的标签密度图像则像素点之间的局部关联损失。 在一个实施例中,还包括: 针对每次下采样处理,采用预设的空间抽象损失函数计算每次下采样后的预测人 群密度图像和对应下采样后的标签密度图像之间的图像损失值;其中,所述空间抽象损失 函数用于获取所述下采样后的预测人群密度图像和对应下采样后的标签密度图像之间的 均方误差损失。 一种网络训练方法,所述方法包括: 获取训练样本图像; 将所述训练样本图像输入至初始神经网络中,得到预测人群密度图像; 对所述预测人群密度图像和对应的标签密度图像分别进行下采样处理,得到下采 样后的预测人群密度图像和对应下采样后的标签密度图像; 根据所述下采样后的预测人群密度图像和对应下采样后的标签密度图像之间的 损失,调整所述初始神经网络的参数,得到所述密度图生成网络。 一种人群密度图的获取装置,所述装置包括: 第一获取模块,用于获取待处理人群图像,所述待处理人群图像包括在人群密集 的拥挤场景下拍摄的图像; 生成模块,用于将所述待处理人群图像输入至预设的密度图生成网络中,得到目 标人群密度图;其中,所述密度图生成网络为对标签密度图像和初始神经网络输出的预测 人群密度图像进行下采样处理,并根据下采样后的预测人群密度图像和下采样后的标签密 度图像之间的损失,对所述初始神经网络进行训练得到的网络。 一种网络训练装置,所述装置包括: 第二获取模块,用于获取训练样本图像; 训练模块,用于将所述训练样本图像输入至初始神经网络中,得到预测人群密度 图像; 采样模块,用于对所述预测人群密度图像和对应的标签密度图像分别进行下采样 处理,得到下采样后的预测人群密度图像和对应下采样后的标签密度图像; 调整模块,用于根据所述下采样后的预测人群密度图像和对应下采样后的标签密 度图像之间的损失,调整所述初始神经网络的参数,得到所述密度图生成网络。 一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理 5 CN 111582252 A 说 明 书 3/14 页 器执行所述计算机程序时实现以下步骤: 获取待处理人群图像,所述待处理人群图像包括在人群密集的拥挤场景下拍摄的 图像; 将所述待处理人群图像输入至预设的密度图生成网络中,得到目标人群密度图; 其中,所述密度图生成网络为对标签密度图像和初始神经网络输出的预测人群密度图像进 行下采样处理,并根据下采样后的预测人群密度图像和下采样后的标签密度图像之间的损 失,对所述初始神经网络进行训练得到的网络; 或者,所述处理器执行所述计算机程序时实现以下步骤: 获取训练样本图像; 将所述训练样本图像输入至初始神经网络中,得到预测人群密度图像; 对所述预测人群密度图像和对应的标签密度图像分别进行下采样处理,得到下采 样后的预测人群密度图像和对应下采样后的标签密度图像; 根据所述下采样后的预测人群密度图像和对应下采样后的标签密度图像之间的 损失,调整所述初始神经网络的参数,得到所述密度图生成网络。 一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执 行时实现以下步骤: 获取待处理人群图像,所述待处理人群图像包括在人群密集的拥挤场景下拍摄的 图像; 将所述待处理人群图像输入至预设的密度图生成网络中,得到目标人群密度图; 其中,所述密度图生成网络为对标签密度图像和初始神经网络输出的预测人群密度图像进 行下采样处理,并根据下采样后的预测人群密度图像和下采样后的标签密度图像之间的损 失,对所述初始神经网络进行训练得到的网络; 或者,所述计算机程序被处理器执行时实现以下步骤: 获取训练样本图像; 将所述训练样本图像输入至初始神经网络中,得到预测人群密度图像; 对所述预测人群密度图像和对应的标签密度图像分别进行下采样处理,得到下采 样后的预测人群密度图像和对应下采样后的标签密度图像; 根据所述下采样后的预测人群密度图像和对应下采样后的标签密度图像之间的 损失,调整所述初始神经网络的参数,得到所述密度图生成网络。 上述人群密度图的获取方法、装置、计算机设备和存储介质,所述人群密度图的获 取方法首先将在人群密集的拥挤场景下拍摄的图像作为待处理人群图像,然后通过将所述 待处理人群图像输入至预设的密度图生成网络中进行人群密度估计的过程得到目标人群 密度图。由于所述密度图生成网络为对标签密度图像和初始神经网络输出的预测人群密度 图像进行下采样处理,并根据下采样后的预测人群密度图像和下采样后的标签密度图像之 间的损失,对所述初始神经网络进行训练得到的网络,因此使用所述预设的密度图生成网 络进行人群密度图估计时不仅考虑了待处理人群图像中单独像素点的表面特征,也考虑了 每个单独像素点的局部相关性信息,避免了传统方法中训练神经网络时仅考虑单独像素点 的表面特征导致的生成的人群密度图的准确率不高的问题,大大提高了生成目标人群密度 图像的准确性;进一步地,由于所述预设的密度图生成网络是基于下采样后的预测人群密 6 CN 111582252 A 说 明 书 4/14 页 度图像和下采样后的标签密度图像之间的损失,对所述初始神经网络进行训练得到的网 络,因此能够实现通过有效利用像素点之间的局部相关性训练初始神经网络的目的,也能 够提高使用所述预设的密度图生成网络对所述待处理人群图像进行人群密度估计的精度, 从而大大提高了所述目标人群密度图像的质量,确保了拥挤场景中人群密度图的准确性。 附图说明 图1为一个实施例中人群密度图的获取方法的流程示意图; 图2为另一实施例中人群密度图的获取方法的流程示意图; 图3为再一实施例中人群密度图的获取方法的流程示意图; 图4为又一实施例中人群密度图的获取方法的流程示意图; 图5为一个实施例中网络训练方法的流程示意图; 图6为一个实施例中人群密度图的获取装置的结构框图; 图7为一个实施例中网络训练装置的结构框图; 图8为一个实施例中计算机设备的内部结构图。
分享到:
收藏