logo好方法网

基于用户APP独热编码的风险评估方法、装置和电子设备


技术摘要:
本发明公开了一种基于用户APP独热编码的风险评估方法、装置、电子设备及计算机可读介质,其中方法包括:获取与用户关联的移动终端的APP安装列表信息;根据APP安装列表信息进行独热编码,获得与用户关联的独热编码特征;建立机器学习模型,使用历史用户的独热编码特征及  全部
背景技术:
在客户充分授权的情况下,获取客户终端应用程序(APP)相关的信息用以风险控 制是消费金融领域的一种普遍做法。对于客户APP信息的挖掘,普遍的做法是对APP进行分 类,然后通过统计客户对某一类APP的安装和使用偏好来进行客户画像。这种做法的缺点在 于APP的分类非常难以维护,因为本身很多APP兼具多重功能,难以将这些APP分到某一类。 比如某APP,既有社交属性,又有理财、支付等功能。受到APP分类准确性得不到保证等因素 的影响,导致这类方法衍生的特征难以对客户进行准确的风险画像,且维护困难。现有技术 中还从其他的维度对APP数据进行挖掘,如根据APP日活跃用户数量将APP分类,挖掘客户安 装的APP命中大众类APP数量等特征;还可以根据APP在自身平台的风险属性进行变量挖掘 等。但都存在挖掘难度较大,投入的人力较多,维护成本较高,稳定性不理想等问题。
技术实现要素:
为了解决如何稳定准确高效完成对用户的授信风险评估的技术问题,本发明提供 了一种基于用户APP独热编码的风险评估方法、装置、电子设备及计算机可读介质。 本发明的一方面提供一种基于用户APP独热编码的风险评估方法,用于评估用户 的金融风险,包括: 获取与用户关联的移动终端的APP安装列表信息,所述用户包括历史用户和新用 户; 根据所述APP安装列表信息进行独热编码,获得与用户关联的独热编码特征; 建立机器学习模型,使用历史用户的独热编码特征及其金融表现数据训练该机器 学习模型; 将新用户的独热编码特征输入所述训练好的机器学习模型,计算该新用户的风险 评分。 根据本发明的优选实施方式,所述根据所述APP安装列表信息进行独热编码,获得 与用户关联的独热编码特征,进一步包括: 获取多个APP的用户覆盖度; 建立APP集合,使得所述APP集合中的各APP的所述用户覆盖度大于预定值; 将用户的APP安装列表与所述APP集合比较以获得所述与用户关联的独热编码特 征。 根据本发明的优选实施方式,所述建立APP集合,使得所述APP集合中的各APP的所 述用户覆盖度大于预定值,进一步包括: 按照所述用户覆盖度由大到小的顺序对所述多个APP排序形成序列; 4 CN 111582649 A 说 明 书 2/9 页 选取所述序列中排名在前预设数量的APP作为APP集合中的APP。 根据本发明的优选实施方式,所述根据所述APP安装列表信息进行独热编码,获得 与用户关联的独热编码特征,进一步包括: 根据所述APP安装列表信息获得APP安装数量,根据APP安装数量是否超过预定值 进行独热编码,获得所述与用户关联的独热编码特征。 根据本发明的优选实施方式,所述根据所述APP安装列表信息进行独热编码,获得 与用户关联的独热编码特征,进一步包括: 根据所述APP安装列表信息获得特定类型的APP安装数量,根据该特定类型的APP 安装数量是否超过预定值进行独热编码,获得所述与用户关联的独热编码特征。 根据本发明的优选实施方式,所述特定类型为多个,由此产生多个独热编码特征。 根据本发明的优选实施方式,所述特定类型包括以下的任意一种:金融类、贷款 类、理财类、社交类、游戏类、工作类。 根据本发明的优选实施方式,所述机器学习模型是极端梯度提升模型。 本发明的第二方面提供一种基于用户APP独热编码的风险评估装置,包括: 信息获取模块,用于获取与用户关联的移动终端的APP安装列表信息,所述用户包 括历史用户和新用户; 信息编码模块,用于根据所述APP安装列表信息进行独热编码,获得与用户关联的 独热编码特征; 模型训练模块,用于建立机器学习模型,使用历史用户的独热编码特征及其金融 表现数据训练该机器学习模型; 特征训练模块,将新用户的独热编码特征输入所述训练好的机器学习模型,计算 该新用户的风险评分。 根据本发明的优选实施方式,所述信息编码模块进一步包括: 覆盖度获取单元,用于获取多个APP的用户覆盖度; 集合建立单元,用于建立APP集合,使得所述APP集合中的各APP的所述用户覆盖度 大于预定值; 比较单元,用于将用户的APP安装列表与所述APP集合比较以获得所述与用户关联 的独热编码特征。 根据本发明的优选实施方式,所述集合建立单元还包括: 排序单元,用于按照所述用户覆盖度由大到小的顺序对所述多个APP排序形成序 列; 筛选单元,用于选取所述序列中排名在前预设数量的APP作为APP集合中的APP。 根据本发明的优选实施方式,所述信息编码模块还包括: 计数单元,用于根据所述APP安装列表信息获得APP安装数量; 第一特征获取单元,用于根据APP安装数量是否超过预定值进行独热编码,获得所 述与用户关联的独热编码特征。 根据本发明的优选实施方式,所述信息编码模块还包括: 分类计数单元,用于根据所述APP安装列表信息获得特定类型的APP安装数量; 第二特征获取单元,用于根据该特定类型的APP安装数量是否超过预定值进行独 5 CN 111582649 A 说 明 书 3/9 页 热编码,获得所述与用户关联的独热编码特征。 根据本发明的优选实施方式,所述特定类型为多个,由此产生多个独热编码特征。 根据本发明的优选实施方式,所述特定类型包括以下的任意一种:金融类、贷款 类、理财类、社交类、游戏类、工作类。 根据本发明的优选实施方式,所述机器学习模型是极端梯度提升模型。 本发明的第三方面提供一种电子设备,其中,该电子设备包括:处理器;以及, 存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行 任一项所述的方法。 本发明的第四方面提供一种计算机可读存储介质,其中,所述计算机可读存储介 质存储一个或多个程序,所述一个或多个程序当被处理器执行时,实现任一项所述的方法。 本发明的技术方案,具有如下有益效果: 本发明通过采集样本用户的移动终端APP安装列表信息,将移动终端APP安装列表 信息转化为独热编码特征,并建立机器学习模型,利用样本用户的独热编码特征和授信风 险结果训练机器学习模型,最后将待授信用户的移动终端APP安装列表信息转化成的独热 编码特征代入训练完成的机器学习模型进行训练从而得到待授信用户的授信风险,操作简 单,易于实现,且评估的授信风险结果准确率高,稳定性较好,在建模和特征维护方面,投入 的人力少,节省资源,效果显著。 附图说明 为了使本发明所解决的技术问题、采用的技术手段及取得的技术效果更加清楚, 下面将参照附图详细描述本发明的具体实施例。但需声明的是,下面描述的附图仅仅是本 发明示例性实施例的附图,对于本领域的技术人员来讲,在不付出创造性劳动的前提下,可 以根据这些附图获得其他实施例的附图。 图1是本发明的一种基于用户APP独热编码的风险评估方法应用场景示意图; 图2是本发明的一种基于用户APP独热编码的风险评估方法流程示意图; 图3是本发明的一种基于用户APP独热编码的风险评估装置模块架构示意图; 图4是本发明的一种基于用户APP独热编码的风险评估的电子设备结构框架示意 图; 图5是本发明的计算机可读存储介质示意图。
分享到:
收藏