logo好方法网

一种高度自动化的票据分类方法及系统


技术摘要:
本发明属于智能做账技术领域,提出了一种高度自动化的票据分类方法及系统,高度自动化的票据分类方法包括获得票据样本集A;配置基础网络模块对票据样本集A进行特征提取;配置G‑Stream模块关注全局信息,计算损失函数一;配置P‑Stream模块关注局部关键信息,计算损失  全部
背景技术:
近几年随着深度学习、计算机硬件以及计算机视觉等技术的不断发展,深度学习 的应用领域越来越广阔,其中财税是深度学习应用的一个重要领域。传统的会计做账是通 过人工进行,具体步骤如下:首先,对各种类型的财务票据进行人工分类整理,如:增值税票 (普通发票、电子发票和专用发票)、银行票、费用票(出租车票、定额票、公路客运票、火车票 等)。其次,将各类财务票据基本信息手工录入至财务软件并且制作对应类别的记账凭证。 该方式自动化程度很低,同时由于财务票据种类繁多,数量大导致分类工作量大、统计麻 烦,耗时耗力,人工成本开支高,工作效率低,繁琐重复的分类工作会导致财务工作人员精 神疲劳,易出错从而降低信息录入的准确率。因此为了准确、高效、高自动化的做账,人们逐 渐将Optical  Character  Recognition(OCR)技术应用于财务票据识别领域。票据识别系统 不但可以减轻工作任务和压力,提高工作效率,还可以解决人工成本上涨与劳动力不足带 来的矛盾,同时推进会计做账数字化、持久化、智能化做账与存储账薄信息,而且方便相关 人员审核与查阅。其中,准确、高效分类票据是票据识别系统的关键。只有将票据分类正确 才能根据该类票据结构对票据信息进行更加精确的识别与信息结构化提取。该方法可大大 提高会计人员的工作效率。但是财务票据的各个大类相似性低,具有较大的类间方差。各大 类类内票据(子类)相似性高,具有较小的类内方差。同时财务票据种类多、结构相似、残缺、 遮挡、褶皱多、大小不一、亮度低或不均匀、颜色相似、几何畸变、拍摄背景复杂、会出现模糊 或者变形等诸多不确定因素导致分类难度大。 目前自动分类方法采用基于人工设计的特征(SIFT、HOG等)结合机器学习分类器 (SVM)进行分类。该分类方法中人工设计的特征依赖票据的版面特征,如:框线、表头、文本 区域等信息。该方式提取的特征表达能力有限,分类准确率低。
技术实现要素:
本发明提出一种高度自动化的票据分类方法及系统,解决了现有技术中票据自动 分类准确率低的问题。 本发明的技术方案是这样实现的:包括 第一方面,本发明提出了一种高度自动化的票据分类方法,包括分类模型训练的 步骤,所述分类模型训练的步骤包括 获得票据样本集A; 配置基础网络模块对票据样本集A进行特征提取,输出特征图一; 配置G-Stream模块关注全局信息,所述G-Stream模块包括依次连接的卷积层一、 全卷积模块一和损失函数一计算模块, 所述卷积层一的输入为特征图一,所述损失函数一计算模块用于计算损失函数一 5 CN 111597958 A 说 明 书 2/11 页 lossg; 配置P-Stream模块关注局部关键信息,所述G-Stream模块包括依次连接的卷积层 二、全局最大池化模块、全卷积模块二和损失函数二计算模块, 所述卷积层二的输入为特征图一,所述全局最大池化模块的输出为特征图二,所 述损失函数二计算模块用于计算损失函数二lossp; 配置S-Stream监督模块,所述S-Stream监督模块包括依次连接的平均池化模块三 和损失函数三计算模块, 所述平均池化模块三的输入为特征图二,所述损失函数三计算模块用于计算损失 函数三losss; 根据损失函数一lossg、损失函数二lossp和损失函数三losss计算总损失函数 losstotal,具体为: losstotal=λ*lossg β*lossp γ*losss 其中,λ、β、γ为权重系数; 判断总损失函数losstotal是否达到设定阈值,如果是,则分类模型训练的步骤完 成,得到票据分类模型D,否则调整基础网络模块、G-Stream模块、P-Stream模块和S-Stream 监督模块的参数,重新执行所述分类模型训练的步骤。 第二方面,本发明提出了一种高度自动化的票据分类系统,包括包括分类模型训 练模块,所述分类模型训练模块包括 第一获得单元,用于获得票据样本集A; 第一计算单元,用于配置基础网络模块对票据样本集A进行特征提取,输出特征图 一; 第二计算单元,用于配置G-Stream模块关注全局信息,所述G-Stream模块包括依 次连接的卷积层一、全卷积模块一和损失函数一计算模块, 所述卷积层一的输入为特征图一,所述损失函数一计算模块用于计算损失函数一 lossg; 第三计算单元,配置P-Stream模块关注局部关键信息,所述G-Stream模块包括依 次连接的卷积层二、全局最大池化模块、全卷积模块二和损失函数二计算模块, 所述卷积层二的输入为特征图一,所述全局最大池化模块的输出为特征图二,所 述损失函数二计算模块用于计算损失函数二lossp; 第四计算单元,用于配置S-Stream监督模块,所述S-Stream监督模块包括依次连 接的平均池化模块三和损失函数三计算模块, 所述平均池化模块三的输入为特征图二,所述损失函数三计算模块用于计算损失 函数三losss; 第五计算单元,用于根据损失函数一lossg、损失函数二lossp和损失函数三losss 计算总损失函数losstotal,具体为: losstotal=λ*lossg β*lossp γ*losss 其中,λ、β、γ为权重系数; 第一判断单元,用于判断总损失函数losstotal是否达到设定阈值,如果是,则分类 模型训练的步骤完成,得到票据分类模型D,否则重新计算损失函数一lossg、损失函数二 6 CN 111597958 A 说 明 书 3/11 页 lossp和损失函数三losss; 第一输出单元,用于输出票据分类模型D。 本发明的工作原理及有益效果为: 本发明提出了票据分类模型训练的步骤,首先配置基础网络进行票据特征的提 取,然后配置G-Stream模块关注全局信息,得到反映全局信息的损失函数一lossg;再配置 P-Stream模块关注局部关键信息,得到反映局部关键信息的损失函数二lossp;再配置S- Stream监督模块,突出票据图片中具有区分性的重点部位,得到反映区分性的损失函数三 losss;总损失函数losstotal由损失函数一lossg、损失函数二lossp和损失函数三losss加权 求和得到,总损失函数losstotal能够兼顾各个层面的信息,这样训练得到的票据分类模型D 输出结果更准确,能够最大限度的减少人工参与,实现了票据分类的高度自动化。 其中,全卷积模块一和全卷积模块二的设置,能够减少整个网络的深度与宽度,避 免特征过多重复,同时减少系统内存消耗与占用。 附图说明 下面结合附图和
分享到:
收藏