
技术摘要:
本发明公开了一种基于用电信息的用户用电行为分析方法,以用户电量信息、负荷信息为基础,结合营销业务系统的用户基础信息,通过分析用电客户的社会属性、生活习惯和消费行为等信息,抽象出标签化的客户信息,建立用户用电行为分析模型及增值服务模型,开展针对性增值 全部
背景技术:
智能电能表是智能电网的基础性、关键性资产,既是获取用户用电信息的源头,也 是获得配网运行数据的重要来源。目前河北省电力公司已基本实现智能表的“全采集、全覆 盖、全费控”,并依托用电信息采集系统深入开展了远程抄表核算及费控管理工作,以上两 项功能均基于智能表的计量及控制功能。除此之外,智能表还具有信息存储及处理、实时监 测、信息交互、异常事件判别等多项高级功能。依托智能表的多项功能,用电信息采集系统 已积累了智能表中包括电量数据、负荷数据以及各类事件在内的海量数据资源。 随着智能电表的大规模推广和用电信息采集系统的建设完成,河北南网用电信息 采集系统已经积累了包括电量数据、负荷数据及各类事件在内的海量数据资源,“一户一 表”模式保证了数据涵盖用户范围的广阔性。并且近两年国网公司大力推广HPLC模块建设 与安装使用,专公变用户、低压用户每日96点准实时数据采集得以实现,这都为用电行为分 析提供了可能。 用电行为作为电力系统里重要的组成部分,对其进行分析的最终目的之一就是对 用电负荷进行调整,根据不同时间段对用户用电进行分析,得到一个分析模型,对用户的未 来用电量进行预测,并将其结果反馈给调度中心和用户,让用户进行用电时段的选择,以避 免谷峰冲突。 用户的用电行为对制定电价有重要的营销,特别是阶梯电价和实施电价正在推 广,国网公司可以根据用户的负荷预测数据制定出具有市场竞争力的电价,同时还要保证 电网公司能够收到较高的盈利回报。
技术实现要素:
本发明所要解决的技术问题是提供一种基于用电信息的用户用电行为分析方法, 具有用户分类准确、用电行为判别精准的特点。 为解决上述问题,本发明所采取的技术方案是: 一种基于用电信息的用户用电行为分析方法,依据用户的底码和负荷数据,进行 实现用户用电行为分析,计算分析某一个时段内用户的用电情况并进行聚类分析,通过建 立模型实现对用户不同时间段的电量计算分析,通过聚类算法对用户用电行为特征进行归 类处理,将用户分为不同的用电类型; 用户用电行为分析的流程为:数据的清洗,对底码、负荷数据的空值进行补全,对 异常值进行替换;低压用户用电行为习惯的分类,因为不同用户的用电规律的差异,对用户 用电行为习惯进行聚类分析,然后对同种用电行为习惯的用户进行分类;建模识别,运用熵 权法分析用户电力数据的特点以及各部分数据的权重,根据求得的数据特点在电力大数据 4 CN 111612228 A 说 明 书 2/6 页 中找到相应特点的数据,确定该部分数据的用户类别;建立不同负荷类型的用户模型,对用 户用电行为进行分析预测。 作为本发明的进一步改进,定义标准用户数据格式,如表1所示: 表1:标准用户数据表 序号 数据表代码 数据表名 1 A_CALC_HOUR_POWER 电表小时级电量统计表 2 A_CALC_HOUR_POWER_ORG 供电单位小时级电量统计表 3 A_CONS_CUR_CURVE 用户电流曲线数据统计表 4 A_CONS_VOL_CURVE 用户电压曲线数据统计表 5 A_CONS_POWER_CURVE 用户负荷曲线数据统计表 。 作为本发明的进一步改进,包括数据缺漏或坏数据的数据修复方法;该数据修复 方法针对负荷数据的横向相似性,利用K-means算法对每个用户的日负荷曲线进行聚类,得 到聚类中心即负荷特征曲线,以此为基准对日24/96点负荷曲线数据进行坏数据的位置识 别与处理。 作为本发明的进一步改进,包括数据级不同用户负荷曲线数据的归一化处理方 法,该归一化处理方法考虑到数量级不同用户负荷曲线模式相同的情况,采用极大值标准 化方法对数据进行归一化处理。 作为本发明的进一步改进,包括根据用户用电行为的启停方式不同以及所受到的 影响因素不同进行用户用电行为影响因子分类的方法;用户用电行为影响因子有三大类: 自我影响因子、自然环境影响因子和社会环境影响因子。 作为本发明的进一步改进,包括基于用电曲线的形状特征以及统计特征的聚类方 法;该聚类方法对具有时序数据进行聚类挖掘,根据电力系统的领域知识提取用电特征,然 后使用K-means算法对得到的特征向量进行聚类。 作为本发明的进一步改进,所述用户用电行为影响因子分类的方法利用数据平滑 将用电数据的随机波动成分剥离出来。 作为本发明的进一步改进,所述用户用电行为影响因子分类的方法对用电曲线的 形状特征提取,其过程为:对移动平滑之后的用电数据,取数据斜率变化最大的N个点,并将 数据分为N 1段;提取N个点处的用电绝对值,计算N l段中每段的均值和方差;经过特征提 取工作,得到3N 2个特征,刻画时序数据曲线的形状特征。 作为本发明的进一步改进,所述用户用电行为影响因子分类的方法基于SparkR的 并行化k-means算法处理电力大数据。 作为本发明的进一步改进,对所述K-means算法做出优化,消除聚类数目初始值的 选择对聚类效果的影响。 采用上述技术方案所产生的有益效果在于: 本发明提出了一种基于用电数据的用户用电行为分析方法,以用户电量信息、负 荷信息为基础,结合营销业务系统的用户基础信息,通过分析用电客户的社会属性、生活习 惯和消费行为等信息,抽象出标签化的客户信息,建立用户用电行为分析模型及增值服务 模型,开展针对性增值服务,提升客户用电满意度。基于电力大数据的用户分类方法更具科 5 CN 111612228 A 说 明 书 3/6 页 学性,分类结果更加准确,具有坚强的理论支撑。对电力用户进行恰当的分类,可以使电网 公司根据用户分类不同提供更具针对性的服务,有助于实现电力行业的资源优化配置,此 外对用户的准确分类使用户用电行为分析更加准确,用户特征更具代表性。 附图说明 为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述 中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些 实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附 图获得其他的附图。 图1是基于SparkR并行化k-means算法的用户行为分析框架; 图2是用户用电行为分析对比图; 图3是单用户用电行为分析6-8月图形展示区; 图4是单用户用电行为分析1-6月及8-12月图形展示区; 图5是供电单位整体用户行为分析的图形展示区。