
技术摘要:
一种生成摘要的方法、系统、设备和计算机可读存储介质,其中,所述方法包括:根据待处理文本确定对应的第一图谱;对第一图谱中的节点按照重要性进行筛选,确定保留节点;根据所述保留节点生成第二图谱,将所述第二图谱作为图谱摘要。本申请实施例用图谱的形式代替序列 全部
背景技术:
在如今这样一个网络信息爆炸的时代里,到处都充斥着各种文本信息,如:官方新 闻、自媒体公众号、朋友圈微博等。然而,从头到尾读完一篇文章会相当耗时,并且并不是每 篇文章都值得仔细阅读。如何快速掌握一篇文章中的内容梗概,成为一个亟待解决的问题。 相关技术中,有如下生成摘要方式: 1、文本自动摘要 文本自动摘要是机器学习领域内的一种算法,能够对冗长文本进行简洁的总结, 归纳为一个小的段落,同时将重点放在传达有用信息的章节,而又不失去文章大意。文本自 动摘要的技术路线可分为两种方式: (1)抽取式 抽取式从文档或者文档集中抽取其中一句话或者几句话,构成摘要。这种方案的 好处在于简单实用,不会完全脱离于文档本身,句子的可读性强,但往往会有信息冗余、内 容不连贯、字数不好控制、目标句主旨不明确等缺点。 (2)生成式 生成式优点是信息不冗余,但往往机器自动生成的句子的可读性差,往往不知所 云。 2、关键词云 关键词云是对海量文字内容中出现频率较高的“关键词”的视觉突出,即出现越多 的“关键词”字体越大,如图1所示。词云的优点是重点突出,缺点是过于精简,缺少关键信息 要素,没有体现要素直接的关系。
技术实现要素:
本申请提供了一种生成摘要的方法、系统、设备和计算机可读存储介质,以消除信 息冗余。提升用户体验。 本申请实施例提供了一种生成摘要的方法,包括: 根据待处理文本确定对应的第一图谱; 对第一图谱中的节点按照重要性进行筛选,确定保留节点; 根据所述保留节点生成第二图谱,将所述第二图谱作为图谱摘要。 本申请实施例还提供一种生成摘要的系统,包括: 图谱确定模块,用于根据待处理文本确定对应的第一图谱; 裁剪模块,用于对第一图谱中的节点按照重要性进行筛选,确定保留节点; 图谱摘要模块,用于根据所述保留节点生成第二图谱,将所述第二图谱作为图谱 4 CN 111581342 A 说 明 书 2/7 页 摘要。 本申请实施例还提供一种生成摘要的设备,包括:存储器、处理器及存储在存储器 上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现所述生成摘要的方 法。 本申请实施例还提供一种计算机可读存储介质,存储有计算机可执行指令,所述 计算机可执行指令用于执行所述生成摘要的方法。 与相关技术相比,本申请实施例包括:根据待处理文本确定对应的第一图谱;对第 一图谱中的节点按照重要性进行筛选,确定保留节点;根据所述保留节点生成第二图谱,将 所述第二图谱作为图谱摘要。本申请实施例用图谱的形式代替序列用于概括文章,信息密 度高,冗余度低,易于读者理解,不用保证句子的可读性,容易实现。 本申请的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变 得显而易见,或者通过实施本申请而了解。本申请的其他优点可通过在说明书以及附图中 所描述的方案来实现和获得。 附图说明 附图用来提供对本申请技术方案的理解,并且构成说明书的一部分,与本申请的 实施例一起用于解释本申请的技术方案,并不构成对本申请技术方案的限制。 图1为一关键词云示例的示意图; 图2为本申请实施例的生成摘要的方法的流程图; 图3为本申请实施例的步骤101的流程图; 图4为本申请实施例的步骤102的流程图; 图5为本申请实施例的一应用示例的图谱摘要的示意图; 图6为本申请实施例的生成摘要的系统的组成示意图。