
技术摘要:
本发明公开一种基于深度嵌入聚类算法的画像建模方法,包括:采集用户信息和商品信息进行聚类得到用户画像和商品画像,进行关联分析得到数据进行神经网络训练得到预测模型和预测结果;本发明针对用户基本信息和商品基本信息,应用深度聚类算法来来客户群体进行画像建模 全部
背景技术:
随着电子商务近年来的不断进步和完善,商品趋于多样化而竞争趋于激烈化。要 想有效保留客户、防止客户流失、提高电子商务系统的销售能力,就要提高电子商务系统的 个性化,让每一个客户都觉得这个网站是为自己量身定制的。客户画像最初也是在电子商 务领域得到应用的,在大数据时代背景下,客户信息充斥在网络中,将客户的每个具体信息 抽象成标签,利用这些标签将客户形象具体化,从而为客户提供有针对性的服务。 聚类分析在电子商务中网站建设数据挖掘中是很重要的一个方面,通过分组聚类 出具有相似浏览行为的客户,并分析客户的共同特征,可以更好的帮助电子商务的用户了 解自己的客户,向客户提供更合适的服务。然而传统的聚类分析算法(如k-means算法)没办 法处理维度较高的复杂数据(如图像数据),无法得到形象较为具体化的客户画像。
技术实现要素:
本发明的目的在于提出一种基于深度嵌入聚类算法的画像建模方法,以解决现有 技术中所存在的一个或多个技术问题,至少提供一种有益的选择或创造条件。 为解决上述技术问题所采用的技术方案:一种基于深度嵌入聚类算法的画像建模 方法,所述方法包括以下步骤: S100、采集用户基本信息,采集商品基本信息,包括商品属性;通过深度嵌入聚类 算法分别对用户基本信息和商品基本信息进行聚类,得到用户画像和商品画像; S200、将用户画像和商品画像进行关联分析得到总样本,总样本分为独立的两部 分:训练集和验证集,训练集占样本的75%,验证集占样本的25%; S300、将训练集的数据输入到神经网络进行训练,得到神经网络预测模型模型;将 验证集的数据输入到神经网络预测模型进行预测,得到预测结果; S400、分析预测结果,通过深度学习算法优化神经网络预测模型;保存神经网络预 测模型。 作为以上技术方案的进一步改进,步骤S100中,深入嵌入聚类算法具体为: S101、使用去噪自编码器进行逐层贪婪训练; S102、将去噪自编码器的编码层按顺序连接、解码层按逆序连接,形成一个栈式自 编码器,对网络参数进行微调; S103、保留栈式自编码器的编码层,移除解码层,在潜在特征空间使用K均值聚类 算法对聚类质心进行初始化; S104、使用KL散度进行迭代,调节网络参数,直到满足收敛判定准则; 其中,深入嵌入聚类算法的过程满足下式: 4 CN 111582912 A 说 明 书 2/5 页 其中,qij表示原始空间xi经过非线性映射到潜在特征空间的嵌入点zj和聚类质心 uj的相似性,也即拟合分布Q的表示,a表示学生t分布的自由度,通常取值为1,qij表达了样 本xi属于类簇uj的概率; 目标分布P由拟合分布Q来定义, 拟合分布Q和目标分布P之间的KL散度为, 作为以上技术方案的进一步改进,步骤S100中,所述用户基本信息包括:客户id、 客户人像、购买商品记录、商品收藏记录、商品浏览记录、用户社会属性;所述用户社会属性 包括:用户年龄、用户收入和用户信用评级。 作为以上技术方案的进一步改进,步骤S100中,所述商品基本信息包括商品属性; 所述商品属性包括:商品类别、商品名称、商品价格和商品的联动性。 作为以上技术方案的进一步改进,步骤S400中,通过深度学习算法优化神经网络 预测模型具体为:通过Batch-size和Learning-rate深度学习算法对神经网络模型进行优 化。 本发明的有益效果:本发明针对用户基本信息和商品基本信息,应用深度聚类算 法来来客户群体进行画像建模、聚类,能够处理复杂的数据,得到形象较为具体化的客户画 像,增强用户体验。 本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变 得明显,或通过本发明的实践了解到。 附图说明 本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得 明显和容易理解,其中: 图1是本发明提供的一种基于深度嵌入聚类算法的画像建模方法的流程图。