
技术摘要:
本申请实施例提供一种从判决书获取当事人量刑要素的方法及装置,所述方法包括:确认输入的文书为刑事案件判决书;基于所述刑事案件判决书中的量刑情节认定文本块获取量刑采纳信息;从所述量刑采纳信息中抽取量刑标签,其中,所述量刑标签与量刑要素对应;建立所述量刑 全部
背景技术:
文本数据挖掘(Text Mining)是指从文本数据中抽取有价值的信息和知识的计算 机处理技术,自然语言处理技术是文本挖掘的基础技术。 由于裁判文书本身结构差异性很大,且裁判文本长度从几百字到上万字不等,因 此针对通篇裁判文书通过文本挖掘技术抽取想要的信息非常困难。由此可知,如何从这些 裁判文书中获取结构化的信息成了亟待解决的技术问题。
技术实现要素:
本申请实施例的目的在于提供一种从判决书获取当事人量刑要素的方法,通过本 申请实施例提供的量刑要素提取方法可以准确快速的从冗长的刑事案件判决书中获取针 对一个或者多个被告人的量刑要素。 第一方面,本申请实施例提供一种从判决书获取当事人量刑要素的方法,所述方 法包括:确认输入的文书为刑事案件判决书;基于所述刑事案件判决书中的量刑情节认定 文本块获取量刑采纳信息;从所述量刑采纳信息中抽取量刑标签,其中,所述量刑标签与量 刑要素对应;建立所述量刑标签与被告人之间的对应关系,得到所述被告人的量刑分析结 果。 通过本申请实施例的处理方法,可以快速准确的从刑事案件判决书中自动抽取出 被告人的量刑要素,便于刑事案件判决书的量刑采纳信息的结构化处理。 在一些实施例中,所述基于所述刑事案件判决书中的量刑情节认定文本块获取量 刑采纳信息之前,所述方法还包括:预处理所述量刑情节认定文本块,以对所述量刑情节认 定文本块中的采纳的量刑情节和不予采纳的量刑情节进行断句;所述基于所述刑事案件判 决书中的量刑情节认定文本块获取量刑采纳信息,包括:从预处理后的量刑情节认定文本 块中获取量刑采纳信息。 本申请实施例通过对量刑情节认定文本块进行预处理操作,一方面可以更好的排 除不予采纳的量刑情节,另一方面,也可以提升量刑标签与被告人的对应关系的准确性。 在一些实施例中,所述预处理所述量刑情节认定文本块,包括:根据不予采纳表达 式定位所述不予采纳的量刑情节在所述量刑情节认定文本块中的第一位置;根据采纳表达 式定位所述采纳的量刑情节在所述量刑情节认定文本块中的第二位置;识别所述第一位置 之后和所述第二位置之后的第一个断句符号并将所述断句符号替换为整句符号;所述从预 处理后的量刑情节认定文本块中获取量刑采纳信息,包括:对采用所述整句符号替换后的 所述量刑情节认定文本块进行分句操作;根据所述不予采纳表达式识别并排除包含所述不 予采纳的量刑情节的句子,得到量刑情节采纳句子;所述从所述量刑采纳信息中抽取量刑 4 CN 111598742 A 说 明 书 2/13 页 标签,包括:从所述量刑情节采纳句子中抽取所述量刑标签。 本申请实施例通过对不予采纳的量刑情节和采纳的量刑情节的断句处理操作可 以进一步提升抽取的量刑标签的准确性,提高量刑标签与被告人对应的准确性。 在一些实施例中,所述确认输入的文书为刑事案件判决书之后,所述的方法还包 括:从所述刑案件判决书中获取被告人名称列表;所述从所述量刑采纳信息中抽取量刑标 签之前,所述方法还包括:根据所述被告人名称列表对所述量刑采纳信息中包括的指代形 式的表述方式进行指代消解。 本申请实施例通过从判决文书中抽取被告人列表可以提升被告人与量刑情节对 应关系的准确性。 在一些实施例中,所述从所述刑事案件判决书中的量刑情节认定文本块获取量刑 采纳信息,包括:根据建立的不予采纳表达式从所述量刑情节认定文本块中排除量刑时不 予采纳的量刑情节,得到所述量刑采纳信息。 本申请实施例通过排除不予采纳的量刑情节后,再提取量刑标签提升量刑采纳信 息的准确性。 在一些实施例中,所述从所述量刑采纳信息中抽取量刑标签,包括:根据为所述量 刑要素建立的规则表达式从所述量刑采纳信息中抽取所述量刑标签。 本申请实施例通过建立量刑要素表达式来提升抽取的量刑标签的准备的完整性 和准确性。 第二方面,本申请实施例提供一种从判决书获取当事人量刑要素的装置,所述装 置包括:确认模块,被配置为确认输入的文书为刑事案件判决书;量刑采纳信息抽取模块, 被配置为基于所述刑事案件判决书中的量刑情节认定文本块获取量刑采纳信息;量刑标签 抽取模块,被配置为从所述量刑采纳信息中抽取量刑标签;映射模块,被配置为建立所述量 刑标签与被告人之间的对应关系,得到所述被告人的量刑分析结果。 在一些实施例中,所述装置还包括:预处理模块,被配置为预处理所述量刑情节认 定文本块,以对所述量刑情节认定文本块中的采纳的量刑情节和不予采纳的量刑情节进行 断句。 第三方面,本申请实施例提供一种计算机可读存储介质,其上存储有计算机程序, 所述程序被处理器执行时可实现上述第一方面所述的方法。 第四方面,本申请实施例提供一种信息处理设备,包括存储器、处理器以及存储在 所述存储器上并可在所述处理器上运行的计算机程序,其中,所述处理器执行所述程序时 可实现上述第一方面所述的方法。 第五方面,本申请提供一种计算机程序产品,所述计算机程序产品在计算机上运 行时,使得计算机执行第一方面可能的实现方式中的方法。 为使本申请实施例所要实现的上述目的、特征和优点能更明显易懂,下文特举较 佳实施例,并配合所附附图,作详细说明如下。 附图说明 为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使 用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看 5 CN 111598742 A 说 明 书 3/13 页 作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以 根据这些附图获得其他相关的附图。 图1为本申请实施例提供的结构化的量刑信息抽取模型示意图; 图2为本申请实施例提供的从判决书获取当事人量刑要素的方法的流程图; 图3为本申请实施例提供的从刑事案件一审判决书中获取当事人量刑要素的方法 的流程图; 图4是本申请实施例提供的从判决书获取当事人量刑要素的装置的组成框图; 图5是本申请实施例提供的信息处理装置的组成示意图。