
技术摘要:
本申请实施例公开了用于识别图像中表格的方法和装置,可用于图像处理技术领域。具体实现方案为:获取待处理图片;识别待处理图片包括的字段名和字段值;获取字段名的语义向量和字段值的语义向量;基于字段名的语义向量和字段值的语义向量与预先训练的匹配模型,确定字 全部
背景技术:
表格是日常工作中一种非常常用的文档形式,但在很多场景下,表格都是以图像 的形式存在的,如何将图片形式的表格转化为能够结构化存储的格式,成为急需解决的问 题。 将图像表格做结构化存储的传统方式多为人工录入,将图片信息对照着录入到数 据系统中,此举耗费大量的人力,并且具有很高的重复性。随着光学字符识别(Optical Character Recognition,OCR)技术的发展,图像到文本数据转化的技术已经趋近成熟,但 是OCR技术并不能确定出字段名与字段值之间的对应关系。
技术实现要素:
本申请实施例提出了用于识别图像中表格的方法、装置、设备以及存储介质。 第一方面,本申请的一些实施例提供了一种用于识别图像中表格的方法,该方法 包括:获取待处理图片;识别待处理图片包括的字段名和字段值;获取字段名的语义向量和 字段值的语义向量;基于字段名的语义向量和字段值的语义向量与预先训练的匹配模型, 确定字段名和字段值的匹配关系;根据字段名和字段值的匹配关系生成表格。 第二方面,本申请的一些实施例提供了一种用于识别图像中表格的装置,该装置 包括:第一获取单元,被配置成获取待处理图片;识别单元,被配置成识别待处理图片包括 的字段名和字段值;第二获取单元,被配置成获取字段名的语义向量和字段值的语义向量; 确定单元,被配置成基于字段名的语义向量和字段值的语义向量与预先训练的匹配模型, 确定字段名和字段值的匹配关系;生成单元,被配置成根据字段名和字段值的匹配关系生 成表格。 第三方面,本申请的一些实施例提供了一种设备,包括:一个或多个处理器;存储 装置,其上存储有一个或多个程序,当上述一个或多个程序被上述一个或多个处理器执行, 使得上述一个或多个处理器实现如第一方面上述的方法。 第四方面,本申请的一些实施例提供了一种计算机可读介质,其上存储有计算机 程序,该程序被处理器执行时实现如第一方面上述的方法。 根据本申请的技术,提高了识别图像中表格的效率。 应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特 征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。 附图说明 附图用于更好地理解本方案,不构成对本申请的限定。其中: 图1是本申请的一些可以应用于其中的示例性系统架构图; 4 CN 111611990 A 说 明 书 2/9 页 图2是根据本申请第一实施例的示意图; 图3是本申请实施例中一个待处理图片的示意图; 图4是根据本申请第二实施例的示意图; 图5是根据本申请第三实施例的示意图; 图6是适于用来实现本申请实施例的用于识别图像中表格的方法的电子设备的结 构示意图。