
技术摘要:
本发明涉及计算机金融科技领域,并公开了一种内容分析查询方法、装置、设备和计算机存储介质。方法包括:在接收到内容分析请求时,获取所述内容分析请求携带的待分析的目标内容;解析所述目标内容获得所述目标内容中的关键词,根据所述关键词确定所述目标内容的内容主 全部
背景技术:
近年来,互联网金融科技(Fintech)的飞速发展,越来越多的技术(大数据、分布 式、区块链Blockchain、人工智能等)应用在计算机金融领域。 现有的金融涉及到的交易种类越来越多,金融交易并不限制为实体物质,还可以 是隐形资产,例如,专利申请、学术作品或者文学作品等内容,金融交易对隐形资产的评估 也就越来越必要,当前对隐形资产的评估通常是通过人实现的,即,人工分析待评估内容, 查找到与待评估内容相似的关联内容,并根据关联内容的价值进行评估,但是人工进行内 容分析查询工作量较大,使得内容分析查询效率较低,此外,由于人工整体水平不同,内容 分析查询的准确率也得不到保证。
技术实现要素:
本发明的主要目的在于提出一种内容分析查询方法、装置、设备和计算机存储介 质,旨在解决当前人工进行内容分析查询工作量较大,内容分析查询效率较低,内容分析查 询的准确率也得不到保证的技术问题。 为实现上述目的,本发明提供一种内容分析查询方法,所述内容分析查询方法包 括如下步骤: 在接收到内容分析请求时,获取所述内容分析请求携带的待分析的目标内容; 解析所述目标内容获得所述目标内容中的关键词,根据所述关键词确定所述目标 内容的内容主题; 查询预设数据库,获取与所述目标内容的内容主题和/或关键词相似的关联内容; 比对所述目标内容与所述关联内容,获得所述目标内容与所述关联内容的相似信 息和差异信息并输出。 可选地,所述查询预设数据库,获取与所述目标内容的内容主题和/或关键词相似 的关联内容的步骤,包括: 查询预设数据库,获取所述预设数据库中与所述目标内容相同技术领域的预存内 容;通过预设主题抽取模型对所述预存内容进行分析,获得所述预存内容的内容主题和所 述内容主题对应的关键词; 在所述目标内容中包含至少两个内容主题和/或所述内容主题中包含至少两个关 键词时,计算所述目标内容的内容主题和/或关键词与所述预存内容的内容主题和/或关键 词的主题相似度和/或词相似度; 将所述主题相似度和/或所述词相似度进行加权运算,获得所述目标内容与所述 预存内容的综合相似度,将与所述目标内容综合相似度高于预设阈值的预存内容作为关联 4 CN 111552783 A 说 明 书 2/11 页 内容。 可选地,所述比对所述目标内容与所述关联内容,获得所述目标内容与所述关联 内容的相似信息和差异信息并输出的步骤,包括: 比对所述目标内容与所述关联内容,将所述目标内容的内容主题划分为相似内容 主题和差异内容主题; 将所述相似内容主题和所述相似内容主题对应的关键字作为相似信息输入至预 设模板中的相似显示区域,将所述差异内容主题和所述差异内容主题对应的关键字作为差 异信息输入至预设模板中的区别显示区域,形成内容分析表。 可选地,所述比对所述目标内容与所述关联内容,获得所述目标内容与所述关联 内容的相似信息和差异信息并输出的步骤之后,所述方法还包括: 获取所述相似信息在所述目标内容中的信息量占比,在所述信息量占比小于预设 占比阈值时,确定所述差异信息是否被所述预存内容数据库中除所述关联内容之外的其他 内容公开; 若所述差异信息未被所述预存内容数据库中除所述关联内容之外的其他内容公 开,则分析所述差异信息在所述目标内容的影响因子并输出; 若所述差异信息被所述预存内容数据库中除所述关联内容之外的其他内容公开, 则输出所述预存内容数据库中公开所述差异信息的差异内容。 可选地,所述解析所述目标内容获得所述目标内容中的关键词,根据所述关键词 确定所述目标内容的内容主题的步骤,包括: 通过预设主题抽取模型对所述目标内容进行分词处理,获得所述目标内容对应的 词语集合,去除所述词语集合中的噪声词,获得所述目标内容中的关键词; 获取所述关键词的位置信息和频率信息,通过预设主题抽取模型根据所述关键词 的位置信息和频率信息确定所述目标内容的内容主题。 可选地,所述通过预设主题抽取模型对所述预存内容进行分析,获得所述预存内 容的内容主题和所述内容主题对应的关键词的步骤之前,包括: 在接收到模型构建请求时,获取初始主题抽取模型,将本地存储中的内容进行标 记形成训练样本集; 从所述训练样本集中抽取主题训练样本,通过所述主题训练样本训练所述初始主 题抽取模型,获得训练后的主题抽取模型和主题特征向量; 通过预设损失函数处理所述主题特征向量,获得损失值,分析所述损失值确定训 练后的主题抽取模型是否收敛; 在检测到训练的主题抽取模型收敛时,将训练得到的主题抽取模型作为预设主题 抽取模型输出。 可选地,所述在接收到内容分析请求时,获取所述内容分析请求携带的待分析的 目标内容的步骤之后,所述方法还包括: 获取所述目标内容的内容格式; 在所述目标内容的内容格式不是文本文档格式时,调用预设OCR模型对所述目标 内容进行检测,确定所述目标内容中的文本区域,并获取所述文本区域中包含的字符信息, 以将所述目标内容转化为文本文档格式; 5 CN 111552783 A 说 明 书 3/11 页 在所述目标内容的内容格式是文本文档格式时,执行所述解析所述目标内容获得 所述目标内容中的关键词,根据所述关键词确定所述目标内容的内容主题的步骤。 此外,为实现上述目的,本发明还提供一种内容分析查询装置,所述内容分析查询 装置包括: 请求接收模块,用于在接收到内容分析请求时,获取所述内容分析请求携带的待 分析的目标内容; 解析确定模块,用于解析所述目标内容获得所述目标内容中的关键词,根据所述 关键词确定所述目标内容的内容主题; 查询获取模块,用于查询预设数据库,获取与所述目标内容的内容主题和/或关键 词相似的关联内容; 比对输出模块,比对所述目标内容与所述关联内容,获得所述目标内容与所述关 联内容的相似信息和差异信息并输出。 此外,为实现上述目的,本发明还提供一种内容分析查询设备,所述内容分析查询 设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的内容分析查 询对应的计算机程序,所述内容分析查询对应的计算机程序被所述处理器执行时实现如上 所述的内容分析查询方法的步骤。 此外,为实现上述目的,本发明还提供一种计算机存储介质,所述计算机存储介质 上存储有内容分析查询对应的计算机程序,所述内容分析查询对应的计算机程序被处理器 执行时实现如上所述的内容分析查询方法的步骤。 本发明提供一种内容分析查询方法、装置、设备和计算机存储介质,本发明实施例 中在接收到内容分析请求时,获取所述内容分析请求携带的待分析的目标内容;解析所述 目标内容获得所述目标内容中的关键词,根据所述关键词确定所述目标内容的内容主题; 查询预设数据库,获取与所述目标内容的内容主题和/或关键词相似的关联内容;比对所述 目标内容与所述关联内容,获得所述目标内容与所述关联内容的相似信息和差异信息并输 出。本发明实施例中通过自动解析目标内容确定目标内容的关键词,然后,根据目标内容的 关键词确定目标内容的内容主题,根据内容主题进行内容查询,获得与目标内容相似的关 联内容,并自动输出内容的相似信息和差异信息,不需要人工进行内容分析,减少了人力资 源的浪费,提高了内容查询的效率和准确率,方便用户查看内容分析查询结果。 附图说明 图1是本发明实施例方案涉及的硬件运行环境的设备结构示意图; 图2为本