
技术摘要:
本申请涉及信息处理领域,特别涉及一种内容推荐方法及计算机可读存储介质。内容推荐方法,包括:根据用户的用户信息,对所述用户进行聚类,得到若干个目标用户群;获取所述目标用户群的行为信息;根据所述目标用户群的行为信息,获取所述目标用户群的推荐内容集合;根 全部
背景技术:
随着互联网的日益普及,人们能够通过互联网获取到的信息也日益丰富,包括但 不限于文章、图片、视频等等。通常来说,以互联网产品为例,互联网产品会根据一个用户对 产品的过往使用行为,来在海量信息中为用户筛选出可能感兴趣的信息来提供给用户,以 提高用户粘度。然而,发明人发现相关技术中存在如下问题:由于新用户使用产品的时间较 短或还未使用过产品,因此新用户对产品的过往使用行为较少或没有,从而导致难以根据 新用户的过往使用行为来进行信息的筛选,筛选出的信息也难以贴合新用户的兴趣,进一 步导致了较差的互联网产品使用体验感。
技术实现要素:
本申请实施例的目的在于提供一种内容推荐方法及计算机可读存储介质,能够为 用户提供丰富的且贴合用户兴趣的推荐内容。 为解决上述技术问题,本申请的实施例提供了一种内容推荐方法,包括:根据用户 的用户信息,对所述用户进行聚类,得到若干个目标用户群;获取所述目标用户群的行为信 息;根据所述目标用户群的行为信息,获取所述目标用户群的推荐内容集合;根据所述目标 用户群的推荐内容集合,获取所述目标用户群内每个用户的推荐内容。 本申请的实施例还提供了一种内容推荐装置,包括:聚类模块,用于根据用户的用 户信息,对所述用户进行聚类,得到若干个目标用户群;第一获取模块,用于获取所述目标 用户群的行为信息;第二获取模块,用于根据所述目标用户群的行为信息,获取所述目标用 户群的推荐内容集合;第三获取模块,用于根据所述目标用户群的推荐内容集合,获取所述 目标用户群内每个用户的推荐内容。 本申请的实施例还提供了一种计算机可读存储介质,存储有计算机程序,计算机 程序被处理器执行时实现上述的内容推荐方法。 本申请实施例相对于现有技术而言,根据用户的用户信息,对所述用户进行聚类, 得到若干个目标用户群;获取所述目标用户群的行为信息;根据所述目标用户群的行为信 息,获取所述目标用户群的推荐内容集合;根据所述目标用户群的推荐内容集合,获取所述 目标用户群内每个用户的推荐内容。由于根据用户的用户信息对用户进行了聚类,那么再 获取聚类得到的目标用户群的行为信息,就是将目标用户群内多个用户的行为信息进行了 聚合,得到的目标用户群的行为信息较为丰富,从而避免了单个用户的行为信息过少导致 无法进行后续处理的情况;根据多样化的目标用户群能够得到丰富的推荐内容集合,从而 有助于为目标用户群内用户提供可选性高的推荐内容以用于筛选,从丰富的推荐内容集合 中筛选出的推荐内容也更易贴合用户的兴趣,以提升用户的使用体验感。 另外,所述获取所述目标用户群的行为信息,包括:根据所述目标用户群内每个用 4 CN 111552883 A 说 明 书 2/9 页 户和所述目标用户群的聚类中心之间的距离,合并所述目标用户群内每个用户的行为信 息,得到所述目标用户群的行为信息。上述提供了一种获取目标用户群的行为信息的方式, 由于目标用户群内用户的行为信息还是存在差异,而用户和聚类中心之间的距离能够反映 用户与目标用户群的相似度,因此根据不同用户与目标用户群的不同相似度来合并每个用 户的行为信息,能够得到较为合理的用户群的行为信息,避免了直接合并时可能忽视了个 体差异的问题。 另外,所述根据所述目标用户群内每个用户和所述目标用户群的聚类中心之间的 距离,合并所述目标用户群内每个用户的行为信息,得到所述目标用户群的行为信息,包 括:根据所述目标用户群内每个用户和所述聚类中心之间的距离,计算所述每个用户的行 为权重;根据每个所述用户的行为权重和行为信息,计算所述目标用户群的行为信息。上述 提供了一种具体计算目标用户群的行为信息的方式,使用行为权重来表示用户与目标用户 群的相似度,简洁明了。 另外,每个用户的行为权重,通过以下公式计算得到: 其中,所述wi,j表示目标用户群i内用户j的行为权重;所述di,j表示所述用户j和所 述目标用户群i的聚类中心之间的距离;所述max(di)表示所述目标用户群i内的用户和所 述目标用户群i的聚类中心之间的最大距离。 另外,目标用户群的行为信息,通过以下公式计算得到: 其中,所述new_scorei ,k表示目标用户群i的第k个行为信息;所述n表示所述目标 用户群i内的用户数量;所述scorek表示所述用户j的第k个行为信息。 另外,根据所述目标用户群的行为信息,获取所述目标用户群的推荐内容集合,包 括:根据所述目标用户群的行为信息,获取所述目标用户群的相似目标用户群;根据所述相 似目标用户群的行为信息,获取所述目标用户群的推荐内容集合。通过相似目标用户群的 行为信息来获取目标用户群的推荐内容集合,也就是共用了其他用户群的兴趣喜好,减少 了推荐内容集合不完全、较片面的情况,具有较强的推荐全新内容的能力。 另外,根据所述目标用户群的推荐内容集合,获取所述目标用户群内每个用户的 推荐内容,包括:计算所述目标用户群内每个用户与所述推荐内容集合内每个推荐内容之 间的相似度;根据所述相似度,获取所述每个用户的推荐内容。 另外,计算所述目标用户群内每个用户与所述推荐内容集合内每个推荐内容之间 的相似度,包括:根据所述每个用户的用户信息和预设嵌入算法,计算所述每个用户的用户 向量,且根据所述每个推荐内容和所述预设嵌入算法,计算所述每个推荐内容的内容向量; 计算每个所述用户向量和每个所述内容向量之间的相似度。通过预设的嵌入算法预先处理 得到用户向量和内容向量,再进行相似度的计算,相较于直接对庞大的原始数据进行计算, 有效降低了庞大的计算量,提升了相似度的计算效率。 5 CN 111552883 A 说 明 书 3/9 页 附图说明 一个或多个实施例通过与之对应的附图中的图片进行示例性说明,这些示例性说 明并不构成对实施例的限定。 图1是根据本申请第一实施例中的内容推荐方法的流程图; 图2是根据本申请第一实施例中步骤103的具体实现方式的流程图; 图3是根据本申请第一实施例中步骤104的具体实现方式的流程图; 图4是根据本申请第二实施例中的内容推荐方法的流程图; 图5是根据本申请第二实施例中步骤202的流程图; 图6是根据本申请第三实施例中内容推荐装置的结构方框图; 图7是根据本申请第四实施例中电子设备的结构方框图。