logo好方法网

用于内容推荐的方法和设备


技术摘要:
描述了一种用于内容推荐的方法,包括:获取用户的历史行为数据和用户画像;获取多个内容文件的内容数据,每个内容文件的内容数据包括所述每个内容文件的至少一个内容属性;基于所述每个内容文件的至少一个内容属性、用户画像和历史行为数据,确定用于表征所述用户对所  全部
背景技术:
随着互联网技术的发展,用户可在互联网上观看或收听各种网站上的视频、音频、 图文、图集等不同类型的内容。同时,网站服务器也可以通过深入挖掘用户兴趣,将符合用 户兴趣的内容以个性化的方式推荐给用户,以提高用户对内容的点击率。
技术实现要素:
在相关技术中,通常基于用户在过去一段时间中的历史兴趣来向用户推荐内容, 然而这容易造成在向用户推荐内容时,用户的长期兴趣依赖严重,短期兴趣刻画不足,不能 及时捕捉用户的兴趣变化。例如,从用户的长期兴趣看,用户有较强的对“钢铁侠”的兴趣、 较弱的对“哪吒”的兴趣,因为该用户历史上点过的“钢铁侠”内容较多、“哪吒”内容较少;从 用户的短期兴趣看,由于近期电影《哪吒之魔童降世》比较火,“钢铁侠”内容最近向用户呈 现了10次,却只点了一次,而“哪吒”内容呈现了3次,却点击3次。显然,用户在短期内对关于 “哪吒”内容更感兴趣,但是在内容推荐时,仍然大量给用户推荐关于“钢铁侠”的内容,却很 少给用户推荐关于“哪吒”的内容,从而造成了内容推荐效率差、准确性低以及用户体验差 的问题。 有鉴于此,本公开提供了用于内容推荐的方法和设备、计算设备和计算机可读存 储介质,期望克服上面提到的部分或全部缺陷以及其它可能的缺陷。 根据本公开的第一方面,  提供了一种用于内容推荐的方法,包括:获取用户的历 史行为数据和用户画像,所述历史行为数据包括与所述用户对内容文件的历史点击相关的 数据,所述用户画像包括所述用户的多个兴趣分类,每个兴趣分类包括内容文件的内容属 性;获取多个内容文件的内容数据,每个内容文件的内容数据包括所述每个内容文件的至 少一个内容属性;基于所述每个内容文件的至少一个内容属性、所述用户画像和历史行为 数据,确定用于表征所述用户对所述每个内容文件的兴趣的多个特征的特征值,所述多个 特征包括点击行为特征,所述点击行为特征与所述用户在预设最近点击数量窗口内的历史 点击中所述至少一个内容属性中的每个内容属性的出现次数相关;至少基于所述多个特征 的特征值确定所述每个内容文件的评分;基于所述多个内容文件的评分从所述多个内容文 件中选取预定数量的内容文件以用于向所述用户进行推荐。 在一些实施例中,获取用户的历史行为数据和用户画像包括:响应于接收到针对 用户的当前内容推荐请求,获取用户的历史行为数据和用户画像。 在一些实施例中,获取用户的历史行为数据和用户画像,包括:获取用户的历史行 为数据;基于所述用户的历史行为数据,获取所述用户的用户画像。 在一些实施例中,所述每个兴趣分类还包括与所述内容文件的内容属性对应的兴 趣度,并且所述点击行为特征包括:所述每个内容属性与用户在至少一个预设最近点击数 5 CN 111552884 A 说 明 书 2/24 页 量子窗口中的每个相应预设最近点击数量子窗口内的历史点击中所述每个内容属性的出 现次数的相应组合特征,所述至少一个预设最近点击数量子窗口是所述预设最近点击数量 窗口的子窗口;以及所述每个内容属性、所述每个内容属性在其对应的兴趣分类中的兴趣 度的排名以及所述每个内容属性的所述出现次数的相应组合特征。 在一些实施例中,所述多个特征还包括点击时间特征,点击时间特征与所述用户 在所述预设最近点击数量窗口内对具有所述每个内容属性的内容文件的历史点击的点击 时间相关。 在一些实施例中,所述点击时间特征包括:具有所述每个内容属性的内容文件在 所述预设最近点击数量窗口内在预定次序被点击时的点击时间与当前内容推荐请求的时 间的时间间隔;以及,具有所述每个内容属性的内容文件在所述预设最近点击数量窗口内 在预定次序被点击时的点击时间与当前内容推荐请求的时间的时间间隔、以及所述每个内 容属性两者的组合特征。 在一些实施例中,所述点击时间特征还包括:具有所述每个内容属性的内容文件 在所述预设最近点击数量窗口内在预定次序被点击时所在的内容推荐请求与当前内容推 荐请求的请求数目间隔;以及,具有所述每个内容属性的内容文件在所述预设最近点击数 量窗口内在预定次序被点击时所在的内容推荐请求与当前内容推荐请求的请求数目间隔、 以及所述每个内容属性两者的组合特征。 在一些实施例中,其中所述历史行为数据还包括与向所述用户呈现内容文件的历 史呈现相关的数据,并且所述多个特征还包括呈现时间特征,呈现时间特征与在预设最近 时段的历史呈现中向用户呈现具有所述至少一个内容属性中的每个内容属性的内容文件 的呈现时间相关。 在一些实施例中,所述呈现时间特征包括:具有所述每个内容属性的内容文件在 所述预设最近时段的历史呈现中在预定次序被呈现的呈现时间与当前内容推荐请求的时 间的时间间隔;以及具有所述每个内容属性的内容文件在所述预设最近时段的历史呈现中 在预定次序被呈现的呈现时间与当前内容推荐请求的时间的时间间隔、以及所述每个内容 属性两者的组合特征。 在一些实施例中,呈现时间特征还包括:具有所述每个内容属性的内容文件在所 述预设最近时段的历史呈现中在预定次序被呈现时所在的内容推荐请求与当前内容推荐 请求的请求数目间隔;以及,具有所述每个内容属性的内容文件在所述预设最近时段的历 史呈现中在预定次序被呈现时所在的内容推荐请求与当前内容推荐请求的请求数目间隔、 以及所述每个内容属性两者的组合特征。 在一些实施例中,获取多个内容文件的内容数据,包括:基于所述用户的用户画像 获取所述多个内容文件的内容数据。 在一些实施例中,基于所述每个内容文件的至少一个内容属性、所述用户画像和 历史行为数据,确定用于表征所述用户对所述每个内容文件的兴趣的多个特征的特征值, 包括:获取所述多个特征中的每个特征的原始值;基于所述每个特征的原始值及相应的特 征名称,得到所述每个特征的特征值。 在一些实施例中,基于所述每个特征的原始值及相应的特征名称,得到所述每个 特征的特征值,包括:对所述每个特征的原始值进行哈希,得到所述每个特征的第一哈希 6 CN 111552884 A 说 明 书 3/24 页 值;对所述每个特征的特征名称字符串进行哈希,得到所述每个特征的第二哈希值;基于所 述每个特征的第一哈希值及第二哈希值,得到所述每个特征的特征值。 在一些实施例中,至少基于所述多个特征的特征值确定所述每个内容文件的评 分,包括:至少将所述多个特征的特征值输入经训练的智能评分模型,得到所述每个内容文 件的评分;所述经训练的智能评分模型根据正样本数据及负样本数据训练得到;其中,在向 所述用户呈现多个内容文件过程中,表征用户对所呈现的多个内容文件中被点击的内容文 件的兴趣的多个特征的特征值作为正样本数据、表征用户对所呈现的多个内容文件中未被 点击的内容文件的兴趣的多个特征的特征值作为负样本数据。 在一些实施例中,基于所述多个内容文件的评分从所述多个内容文件中选取预定 数量的内容文件以用于向所述用户进行推荐,包括:基于所述多个内容文件的评分,按照评 分高低对所述多个内容文件进行排序,得到内容文件的有序序列;从所述内容文件的有序 序列中第一个内容文件开始选取预定数量的内容文件以用于向所述用户进行推荐。 根据本公开的第二方面,提供了一种用于内容推荐的方法,包括:获取根据本公开 的第一方面所述的方法选取的用于向用户进行推荐的预定数量的内容文件;呈现所述预定 数量的内容文件。 根据本公开的第三方面,提供了一种用于内容推荐的设备,包括:第一获取模块, 被配置成获取用户的历史行为数据和用户画像,所述历史行为数据包括与所述用户对内容 文件的历史点击相关的数据,所述用户画像包括所述用户的多个兴趣分类,每个兴趣分类 包括内容文件的内容属性;第二获取模块,被配置成获取多个内容文件的内容数据,每个内 容文件的内容数据包括所述每个内容文件的至少一个内容属性;第一确定模块,被配置成 基于所述每个内容文件的至少一个内容属性、所述用户画像和历史行为数据,确定用于表 征所述用户对所述每个内容文件的兴趣的多个特征的特征值,所述多个特征包括点击行为 特征,所述点击行为特征与所述用户在预设最近点击数量窗口内的历史点击中所述至少一 个内容属性中的每个内容属性的出现次数相关;第二确定模块,被配置成至少基于所述多 个特征的特征值确定所述每个内容文件的评分;选取模块,被配置成基于所述多个内容文 件的评分从所述多个内容文件中选取预定数量的内容文件以用于向所述用户进行推荐。 根据本公开的第四方面,提供了一种用于内容推荐的设备,包括:内容文件获取模 块,被配置成从根据本公开的第三方面所述的设备获取用于向用户进行推荐的预定数量的 内容文件;呈现模块,被配置成呈现所述预定数量的内容文件。 根据本公开的第五方面,提供了一种计算设备,包括处理器;以及存储器,配置为 在其上存储有计算机可执行指令,当计算机可执行指令被处理器执行时执行如上面所述的 任意方法。 根据本公开的第六方面,提供了一种计算机可读存储介质,其存储有计算机可执 行指令,当所述计算机可执行指令被执行时,执行如上面所述的任意方法。 在本公开要求保护的用于内容推荐的方法和设备中,通过在内容推荐时使用与所 述用户在预设最近点击数量窗口内每个内容属性的出现次数相关的点击行为特征,使得在 内容推荐时能够充分体现用户的短期兴趣并且快速体现用户兴趣的变化,从而能够极大提 高内容推荐的准确度,提升推荐内容的点击率、点击量等关键指标。 根据下文描述的实施例,本公开的这些和其它优点将变得清楚,并且参考下文描 7 CN 111552884 A 说 明 书 4/24 页 述的实施例来阐明本公开的这些和其它优点。 附图说明 现在将更详细并且参考附图来描述本公开的实施例,其中: 图1图示了根据本公开的实施例的技术方案可以实施在其中的示例性应用场景; 图2示出了根据本公开的一个实施例的用于内容推荐的方法的示意性流程图; 图3示出了根据本公开的一个实施例的用户的层次化结构的兴趣分类的示意图; 图4示出了根据本公开的一个实施例的确定点击行为特征的示意图; 图5示出了根据本公开的一个实施例的确定点击行为特征的实例图; 图6示出了根据本公开的一个实施例的确定点击时间特征和呈现时间特征的示意图; 图7示出了根据本公开的另一个实施例的用于内容推荐的方法的示意性流程图; 图8示出了根据本公开的一个实施例的用于内容推荐的方法的架构示意图; 图9示出了根据本公开的一个实施例的对视频进行排序的架构示意图; 图10图示了根据本公开的一个实施例的点击率预估的整体流程; 图11示出了根据本公开的一个实施例的模型训练的架构示意图; 图12示出了对根据本公开实施例的用于内容推荐的方法推荐的内容文件进行呈现的 示意图; 图13图示了根据本公开的一个实施例的用于内容推荐的设备的示例性结构图; 图14图示了根据本公开的另一个实施例的用于内容推荐的设备的示例性结构图;以及 图15图示了一个示例系统,其包括代表可以实现本文描述的各种技术的一个或多个系 统和/或设备的示例计算设备。
分享到:
收藏