logo好方法网

一种数据处理方法、装置和电子设备


技术摘要:
本发明实施例提供了一种数据处理方法、装置和电子设备,其中,所述方法包括:获取待检测搜索结果页的配置信息,所述配置信息包括所述待检测搜索结果页的网页地址和所述待检测搜索结果页中待检测搜索结果项的类别标识;依据所述网页地址确定所述待检测搜索结果页,从所  全部
背景技术:
随着互联网技术的不断发展,以及搜索引擎技术的发展,用户可以通过搜索平台 进行信息查询。例如用户在搜索平台中输入搜索词,执行搜索操作后,搜索平台可以将搜索 结果在搜索结果页中展示,用户可以在搜索结果页中选取任一搜索结果,进入对应的网页 页面进行浏览。 其中,搜索平台展示的搜索结果页可能会出现页面样式错乱的问题,目前检测搜 索结果页的页面样式是否错乱的方式是,对整个搜索结果页进行检测。由于部分查询词的 结果实效性很强(如新闻类查询词、天气类查询词),使得这些查询词对应搜索结果页中的 某一条或多条搜索结果,在不同时刻对应的页面样式可能不同;进而不同时刻对该搜索结 果页面进行检测时,可能会检测到一个或多个样式错乱的区域,导致误报,检测准确性低。
技术实现要素:
本发明实施例提供一种数据处理方法,以提高页面检测的准确性。 相应的,本发明实施例还提供了一种数据处理装置和一种电子设备,用以保证上 述方法的实现及应用。 为了解决上述问题,本发明实施例公开了一种数据处理方法,具体包括:获取待检 测搜索结果页的配置信息,所述配置信息包括所述待检测搜索结果页的网页地址和所述待 检测搜索结果页中待检测搜索结果项的类别标识;依据所述网页地址确定所述待检测搜索 结果页,从所述待检测搜索结果页中提取所述类别标识对应待检测搜索结果项的目标图 像,所述目标图像依据所述类别标识对应待检测搜索结果项的展示区域确定;将所述目标 图像与对应预存的参考图像进行相似度比对,依据相似度比对结果推送提示信息。 可选地,所述配置信息还包括终端标识,所述依据所述网页地址确定所述待检测 搜索结果页,包括:打开所述网页地址,按照所述终端标识对应的页面样式展示所述待检测 搜索结果页。 可选地,所述将所述目标图像与对应预存的参考图像进行相似度比对,包括:将所 述目标图像与预存的所述终端标识对应的参考图像进行相似度比对。 可选地,所述从所述待检测搜索结果页中提取所述类别标识对应待检测搜索结果 项的目标图像,包括:基于所述类别标识查找映射关系,确定所述待检测搜索结果项在所述 搜索结果页中的目标区域信息;依据所述目标区域信息,对所述待检测搜索结果页中所述 目标区域信息对应的展示区域进行截图,得到目标图像。 可选地,所述从所述待检测搜索结果页中提取所述类别标识对应待检测搜索结果 项的目标图像,包括:获取所述待检测搜索结果页对应的页面图像;基于所述类别标识查找 映射关系,确定所述待检测搜索结果项在所述搜索结果页中的目标区域信息;依据所述目 4 CN 111611470 A 说 明 书 2/15 页 标区域信息,从所述页面图像中截取目标图像。 可选地,所述基于所述类别标识查找映射关系,确定所述待检测搜索结果项在所 述搜索结果页中的目标区域信息,包括:基于所述类别标识查找映射关系,确定所述类别标 识对应待检测搜索结果项在所述搜索结果页中最外层展示区域图层的区域信息;将所述最 外层展示区域图层的区域信息,确定为所述搜索结果页中所述类别标识对应待检测搜索结 果项对应的目标区域信息。 可选地,所述目标区域信息包括:所述最外层展示区域图层的左上角位置点对应 的位置信息,和,最外层显示区域图层的尺寸。 可选地,所述参考图像包括:基准样式图像和容错样式图像;所述将所述目标图像 与对应预存的参考图像进行相似度比对,包括:将所述目标图像与对应的基准样式图像进 行相似度比对,确定第一相似度;若所述第一相似度低于相似度阈值,则将所述目标图像与 对应的容错样式图像进行相似度比对,确定第二相似度。 本发明实施例还公开了一种数据处理装置,具体包括:信息获取模块,用于获取待 检测搜索结果页的配置信息,所述配置信息包括所述待检测搜索结果页的网页地址和所述 待检测搜索结果页中待检测搜索结果项的类别标识;图像提取模块,用于依据所述网页地 址确定所述待检测搜索结果页,从所述待检测搜索结果页中提取所述类别标识对应待检测 搜索结果项的目标图像,所述目标图像依据所述类别标识对应待检测搜索结果项的展示区 域确定;图像比对模块,用于将所述目标图像与对应预存的参考图像进行相似度比对,依据 相似度比对结果推送提示信息。 可选地,所述配置信息还包括终端标识,所述图像提取模块包括:页面展示子模 块,用于打开所述网页地址,按照所述终端标识对应的页面样式展示所述待检测搜索结果 页。 可选地,所述图像比对模块包括:第一相似度对比子模块,用于将所述目标图像与 预存的所述终端标识对应的参考图像进行相似度比对。 可选地,所述图像提取模块包括:信息查找子模块,用于基于所述类别标识查找映 射关系,确定所述待检测搜索结果项在所述搜索结果页中的目标区域信息;第一提取子模 块,用于依据所述目标区域信息,对所述待检测搜索结果页中所述目标区域信息对应的展 示区域进行截图,得到目标图像。 可选地,所述图像提取模块包括:图像获取子模块,用于获取所述待检测搜索结果 页对应的页面图像;信息查找子模块,用于基于所述类别标识查找映射关系,确定所述待检 测搜索结果项在所述搜索结果页中的目标区域信息;第二提取子模块,用于依据所述目标 区域信息,从所述页面图像中截取目标图像。 可选地,所述信息查找子模块,用于基于所述类别标识查找映射关系,确定所述类 别标识对应待检测搜索结果项在所述搜索结果页中最外层展示区域图层的区域信息;将所 述最外层展示区域图层的区域信息,确定为所述搜索结果页中所述类别标识对应待检测搜 索结果项对应的目标区域信息。 可选地,所述目标区域信息包括:所述最外层展示区域图层的左上角位置点对应 的位置信息,和,最外层显示区域图层的尺寸。 可选地,所述参考图像包括:基准样式图像和容错样式图像;所述图像比对模块包 5 CN 111611470 A 说 明 书 3/15 页 括:第二相似度对比子模块,用于将所述目标图像与对应的基准样式图像进行相似度比对, 确定第一相似度;若所述第一相似度低于相似度阈值,则将所述目标图像与对应的容错样 式图像进行相似度比对,确定第二相似度。 本发明实施例还公开了一种可读存储介质,当所述存储介质中的指令由电子设备 的处理器执行时,使得电子设备能够执行如本发明实施例任一所述的数据处理方法。 本发明实施例还公开了一种电子设备,包括有存储器,以及一个或者一个以上的 程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理 器执行所述一个或者一个以上程序包含用于进行以下操作的指令:获取待检测搜索结果页 的配置信息,所述配置信息包括所述待检测搜索结果页的网页地址和所述待检测搜索结果 页中待检测搜索结果项的类别标识;依据所述网页地址确定所述待检测搜索结果页,从所 述待检测搜索结果页中提取所述类别标识对应待检测搜索结果项的目标图像,所述目标图 像依据所述类别标识对应待检测搜索结果项的展示区域确定;将所述目标图像与对应预存 的参考图像进行相似度比对,依据相似度比对结果推送提示信息。 可选地,所述配置信息还包括终端标识,所述依据所述网页地址确定所述待检测 搜索结果页,包括:打开所述网页地址,按照所述终端标识对应的页面样式展示所述待检测 搜索结果页。 可选地,所述将所述目标图像与对应预存的参考图像进行相似度比对,包括:将所 述目标图像与预存的所述终端标识对应的参考图像进行相似度比对。 可选地,所述从所述待检测搜索结果页中提取所述类别标识对应待检测搜索结果 项的目标图像,包括:基于所述类别标识查找映射关系,确定所述待检测搜索结果项在所述 搜索结果页中的目标区域信息;依据所述目标区域信息,对所述待检测搜索结果页中所述 目标区域信息对应的展示区域进行截图,得到目标图像。 可选地,所述从所述待检测搜索结果页中提取所述类别标识对应待检测搜索结果 项的目标图像,包括:获取所述待检测搜索结果页对应的页面图像;基于所述类别标识查找 映射关系,确定所述待检测搜索结果项在所述搜索结果页中的目标区域信息;依据所述目 标区域信息,从所述页面图像中截取目标图像。 可选地,所述基于所述类别标识查找映射关系,确定所述待检测搜索结果项在所 述搜索结果页中的目标区域信息,包括:基于所述类别标识查找映射关系,确定所述类别标 识对应待检测搜索结果项在所述搜索结果页中最外层展示区域图层的区域信息;将所述最 外层展示区域图层的区域信息,确定为所述搜索结果页中所述类别标识对应待检测搜索结 果项对应的目标区域信息。 可选地,所述目标区域信息包括:所述最外层展示区域图层的左上角位置点对应 的位置信息,和,最外层显示区域图层的尺寸。 可选地,所述参考图像包括:基准样式图像和容错样式图像;所述将所述目标图像 与对应预存的参考图像进行相似度比对,包括:将所述目标图像与对应的基准样式图像进 行相似度比对,确定第一相似度;若所述第一相似度低于相似度阈值,则将所述目标图像与 对应的容错样式图像进行相似度比对,确定第二相似度。 本发明实施例包括以下优点: 本发明实施例中,可以通过获取包含网页地址和类别标识的配置信息,然后依据 6 CN 111611470 A 说 明 书 4/15 页 所述网页地址确定搜索结果页,提取所述搜索结果页中所述类别标识对应目标图像,实现 提取单个搜索结果项对应的目标图像;然后将单个搜索结果项的目标图像与参考图像进行 相似度比对,依据相似度比对结果推送提示信息;进而通过对单个搜索结果项的图像的比 对,去除无需检测样式的搜索结果项的图像对比对结果的影响,从而提高检测准确性。 附图说明 图1是本发明的一种数据处理方法实施例的步骤流程图; 图2是本发明的一种数据处理方法可选实施例的步骤流程图; 图3是本发明的一种数据处理装置实施例的结构框图; 图4是本发明的一种数据处理装置可选实施例的结构框图; 图5根据一示例性实施例示出的一种用于数据处理的电子设备的结构框图; 图6是本发明根据另一示例性实施例示出的一种用于数据处理的电子设备的结构 示意图。
分享到:
收藏