logo好方法网

文档图像朝向检测方法和装置


技术摘要:
本申请公开了文档图像朝向检测方法和装置,涉及计算机视觉技术领域。该方法的一具体实施方式包括:将待测文档的图像中的前景点向第一坐标轴进行投影,得到多个第一投影点的分布信息,其中,第一坐标轴与图像的像素行方向或列方向平行;基于多个第一投影点分布信息,确  全部
背景技术:
图像识别技术的一个主要方向是按照所观测到的图像,对图像中的物体进行分 辨,以此来做好相应的具有意义的判断,具体实现则是应用现代信息处理技术,以及计算机 对人类认知过程进行模拟。 在文档处理技术中,经常需要通过图像识别技术从文档图像中识别出文本图像, 并利用识别到的文本图像来进行后续的诸如文档方向矫正、光学字符识别等处理。 由于一个文档图像中所包括的文本图像的朝向可能是不同的,通常需要对文本图 像的朝向进行检测,目前的文档朝向检测技术,在准确性和处理效率上存在不足。
技术实现要素:
提供了一种文档图像朝向检测方法、装置、电子设备以及计算机可读介质。 根据第一方面,提供了一种文档图像朝向检测方法,上述方法包括:将待测文档的 图像中的前景点向第一坐标轴进行投影,得到多个第一投影点的分布信息,其中,第一坐标 轴与图像的像素行方向或列方向平行;基于多个第一投影点分布信息,确定待测文档的文 本行方向。 根据第二方面,提供了一种文档图像朝向检测装置,该装置包括:第一投影模块, 被配置成将待测文档的图像中的前景点向第一坐标轴进行投影,得到多个第一投影点的分 布信息,其中,第一坐标轴与图像的像素行方向或列方向平行;方向确定模块,被配置成基 于多个第一投影点分布信息,确定待测文档的文本行方向。 根据第三方面,提供了一种电子设备,该电子设备包括:至少一个处理器;以及与 至少一个处理器通信连接的存储器,其中,存储器存储有可被至少一个处理器执行的指令, 指令被至少一个处理器执行,以使至少一个处理器能够执行如第一方面任一实现方式描述 的方法。 根据第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,计 算机指令用于使计算机执行如第一方面任一实现方式描述的方法。 本申请的实施例提供的文档图像朝向检测方法和装置,首先将待测文档的图像中 的前景点向第一坐标轴进行投影,得到多个第一投影点的分布信息,其中,第一坐标轴与图 像的像素行或列方向平行。然后基于多个第一投影点分布信息,确定待测文档的文本行方 向。由此,通过对文档的图像中的前景点进行投影分布分析,确定待测文档的文本行方向, 操作简单,实现容易,可以准确、高效地检测具有密集文本的文档的文本行朝向。 应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特 征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。 5 CN 111582151 A 说 明 书 2/11 页 附图说明 附图用于更好地理解本方案,不构成对本申请的限定。其中: 图1是根据本申请文档图像朝向检测方法的一个实施例的流程图; 图2是根据本申请的一个应用场景中多个第一投影点沿第一坐标轴的分布示意 图; 图3是根据本申请的另一个应用场景中多个第一投影点沿第一坐标轴的分布示意 图; 图4是根据本申请文档图像朝向检测方法的另一个实施例的流程图; 图5是根据本申请的一个应用场景中包围待测文档的外接矩形的示意图; 图6是根据本申请的一个应用场景中最短距离值的分布曲线的示意图; 图7是根据本申请文档图像朝向检测方法的再一个实施例的流程图; 图8是根据本申请文档图像朝向检测装置的一个实施例的结构示意图; 图9是用来实现本申请实施例的文档图像朝向检测方法的电子设备的框图。
分享到:
收藏