
技术摘要:
本说明书提出了一种主题生成方法、装置和电子设备。其中,所述方法包括:确定标签集合,所述标签集合中包含多个标签;确定所述多个标签分别对应的人群分布特征;将所述多个标签分别对应的人群分布特征输入到深度网络模型中,以基于所述深度网络模型中的监督信息对所述 全部
背景技术:
在推荐系统中,为了促进商家产品、服务的业务转化,可以在产品、服务的展示页 面、推广消息中设置一定的主题。主题作为一种聚合产品、服务信息的有效方式,可以快速 增加用户对产品、服务的认知,便于用户做出决策,因此为产品、服务设置主题被越来越多 地应用于推荐领域。 相关技术中,主题一般由多个标签组成。理论上可以将任意N个标签组合为一个主 题。但通过此种方式产生的主题可能会没有实际意义或者不符合常规逻辑。比如将 “消费 档次很高”和“大学生”两个标签组合得到的主题“消费档次很高的大学生”。因为在大多数 情况下,大学生的收入水平比较有限,甚至没有收入,因此将“消费档次很高”和“大学生”组 合在一起没有太大意义。另一种生成主题的方式还可以是,根据用户的历史行为数据,通过 统计共现的方式生成主题。但这种方式也会存在因为数据不置信或者阈值设计不合理,导 致产出的主题没有意义的现象。因此如何确保所生成的主题符合逻辑,具有意义成为一个 需要解决的问题。
技术实现要素:
本说明书实施例提供了一种主题生成方法、装置和电子设备,基于该方案能够确 保所生成的主题符合人群分布逻辑,且可解释性较强。 第一方面,本说明书实施例提供了一种主题生成方法,包括: 确定标签集合,所述标签集合中包含多个标签; 确定所述多个标签分别对应的人群分布特征; 将所述多个标签分别对应的人群分布特征输入到深度网络模型中,以基于所述深度网 络模型中的监督信息对所述多个标签对应的人群分布特征进行更新; 根据不同标签之间人群分布特征的相似度,从所述多个标签中选取标签并基于所选取 标签生成主题。 上述实施例中,在生成产品、服务的主题时,首先确定可供选择的标签。可以理解, 对于每个标签其代表一定的人群,因此可以根据标签对应的人群获取标签的人群特征表 示,即确定每个标签对应的人群分布特征;将各个标签对应的人群分布特征输入到深度网 络模型中,以通过深度网络模型中的监督信息对多个标签的人群分布特征进行更新。之后, 根据不同标签之间人群分布特征的相似度,从多个标签中选取标签生成主题。例如,可以将 具有高相似度人群分布特征的标签组合为主题。即,将所代表人群具有高相似度的标签组 合为主题。可见,本方案通过人群分布特征表示各个标签,并根据人群分布特征之间的相似 度选取用于生成主题的标签,从而使得所生成主题符合人群分布逻辑。而且从人群语义角 度选择标签生成主题,使得所生成主题的可解释性更对更强。 4 CN 111553145 A 说 明 书 2/10 页 其中一种可能的实现方式中,确定所述多个标签分别对应的人群分布特征,包括: 确定所述多个标签分别对应的人群数据; 根据对所述多个标签所对应人群数据的分布统计,确定所述多个标签分别对应的人群 分布特征;或者, 根据所述多个标签对应的人群数据之间的行为共现关系或者社交关系,建立人与人之 间的关系图;将所述人与人之间的关系图输入到图网络模型中,基于图网络模型学习每个 人的单人特征;通过对每个标签所对应人群的单人特征的各个维度对应相加、取平均值或 者取最大值,得到所述多个标签对应的人群分布特征。 其中一种可能的实现方式中,所述监督信息为门店约束信息;基于所述深度网络 模型中的监督信息对所述多个标签对应的人群分布特征进行更新,包括: 基于门店约束信息判断所述多个标签中的任意N个标签是否出现在同一门店中;其中, 所述N大于或者等于2; 通过深度神经网络对出现在同一门店的N个标签的人群分布特征进行更新,以提高出 现在同一门店的N个标签之间人群分布特征的相似度。 其中一种可能的实现方式中,所述方法还包括: 通过深度神经网络对没有出现在同一门店的N个标签的人群分布特征进行更新,以降 低没有出现在同一门店的N个标签之间人群分布特征的相似度。 其中一种可能的实现方式中,所述标签对应的人群分布特征中包含多个特征要 素;对N个标签的人群分布特征进行更新,包括: 对N个标签的人群分布特征的各特征要素的权重进行更新。 其中一种可能的实现方式中,根据不同标签之间人群分布特征的相似度,从所述 多个标签中选取标签并基于所选取标签生成主题,包括: 对所述标签集合中的各个标签进行组合,得到多个标签组合;其中每个标签组合中至 少包含两个标签; 根据标签组合中所包含标签之间的人群分布特征的相似度,将相似度高于设定阈值的 标签组合确定为生成的主题。 其中一种可能的实现方式中,基于所选取标签生成主题,包括: 根据所选取标签以及所选取标签对应的人群分布特征生成主题。 第二方面,本说明书实施例提供了一种主题生成装置,包括: 确定模块,用于确定标签集合,所述标签集合中包含多个标签;以及确定所述多个标签 分别对应的人群分布特征; 特征更新模块,用于将所述多个标签分别对应的人群分布特征输入到深度网络模型 中,以基于所述深度网络模型中的监督信息对所述多个标签对应的人群分布特征进行更 新; 主题生成模块,用于根据不同标签之间人群分布特征的相似度,从所述多个标签中选 取标签并基于所选取标签生成主题。 其中一种可能的实现方式中,所述确定模块,具体用于确定所述多个标签分别对 应的人群数据;根据对所述多个标签所对应人群数据的分布统计,确定所述多个标签分别 对应的人群分布特征;或者,根据所述多个标签对应的人群数据之间的行为共现关系或者 5 CN 111553145 A 说 明 书 3/10 页 社交关系,建立人与人之间的关系图;将所述人与人之间的关系图输入到图网络模型中,基 于图网络模型学习每个人的单人特征;通过对每个标签所对应人群的单人特征的各个维度 对应相加、取平均值或者取最大值,得到所述多个标签对应的人群分布特征。 其中一种可能的实现方式中,所述监督信息为门店约束信息; 所述特征更新模块,具体用于基于门店约束信息判断所述多个标签中的任意N个标签 是否出现在同一门店中;其中,所述N大于或者等于2;通过深度神经网络对出现在同一门店 的N个标签的人群分布特征进行更新,以提高出现在同一门店的N个标签之间人群分布特征 的相似度。 其中一种可能的实现方式中,所述特征更新模块,还用于通过深度神经网络对没 有出现在同一门店的N个标签的人群分布特征进行更新,以降低没有出现在同一门店的N个 标签之间人群分布特征的相似度。 其中一种可能的实现方式中,所述标签对应的人群分布特征中包含多个特征要 素; 所述特征更新模块,具体用于对N个标签的人群分布特征的各特征要素的权重进行更 新。 其中一种可能的实现方式中,所述主题生成模块,具体用于对所述标签集合中的 各个标签进行组合,得到多个标签组合;其中每个标签组合中至少包含两个标签;根据标签 组合中所包含标签之间的人群分布特征的相似度,将相似度高于设定阈值的标签组合确定 为生成的主题。 其中一种可能的实现方式中,所述主题生成模块,具体用于根据所选取标签以及 所选取标签对应的人群分布特征生成主题。 第三方面,本说明书实施例提供一种电子设备,包括: 至少一个处理器;以及 与所述处理器通信连接的至少一个存储器,其中: 所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能 够执行第一方面提供的方法。 第四方面,本说明书实施例提供一种非暂态计算机可读存储介质,所述非暂态计 算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行第一方面提供的方 法。 应当理解的是,本说明书的第二~第四方面与本说明书的第一方面的技术方案一 致,各方面及对应的可行实施方式所取得的有益效果相似,不再赘述。 附图说明 为了更清楚地说明本说明书实施例的技术方案,下面将对实施例中所需要使用的 附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书的一些实施例,对于本 领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的 附图。 图1为本说明书主题生成方法一个实施例的流程图; 图2为本说明书主题生成方法另一个实施例的流程图; 6 CN 111553145 A 说 明 书 4/10 页 图3为本说明书主题生成方法的一个计算模型示意图; 图4为本说明书主题生成装置一个实施例的结构示意图; 图5为本说明书电子设备一个实施例的结构示意图。