[go: up one dir, main page]

CN111612275B - 一种预测区域用户负荷量的方法及装置 - Google Patents

一种预测区域用户负荷量的方法及装置 Download PDF

Info

Publication number
CN111612275B
CN111612275B CN202010471759.3A CN202010471759A CN111612275B CN 111612275 B CN111612275 B CN 111612275B CN 202010471759 A CN202010471759 A CN 202010471759A CN 111612275 B CN111612275 B CN 111612275B
Authority
CN
China
Prior art keywords
user
predicted
data
load
electricity utilization
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010471759.3A
Other languages
English (en)
Other versions
CN111612275A (zh
Inventor
王凌谊
王志敏
顾洁
陈宇
李静涛
张秀钊
刘明伟
刘娟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yunnan Power Grid Co Ltd
Original Assignee
Yunnan Power Grid Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yunnan Power Grid Co Ltd filed Critical Yunnan Power Grid Co Ltd
Priority to CN202010471759.3A priority Critical patent/CN111612275B/zh
Publication of CN111612275A publication Critical patent/CN111612275A/zh
Application granted granted Critical
Publication of CN111612275B publication Critical patent/CN111612275B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Tourism & Hospitality (AREA)
  • General Engineering & Computer Science (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Supply And Distribution Of Alternating Current (AREA)

Abstract

本申请提供一种预测区域用户负荷量的方法及装置。本申请的方法包括:获取待预测区域内的用户数据;待预测区域内的用户数据,从多个用电类型中确定待预测用户的用电类型;根据待预测用户的用电类型,以及各用电类型分别对应的负荷预测概率模型,确定目标负荷预测概率模型;将待预测用户的天气数据和待预测用户的日期数据,输入目标负荷预测概率模型,得到目标负荷预测概率模型的输出结果;根据输出结果,确定待预测用户的预测用电负荷量;根据待预测区域内所有待预测用户的预测用电负荷量,确定待预测区域的总预测用电负荷量。本申请针对不同的用电类型匹配不同的负荷预测概率模型,可以提高用电负荷量预测的精准性。

Description

一种预测区域用户负荷量的方法及装置
技术领域
本申请涉及电力技术领域,特别涉及一种预测区域用户负荷量的方法及装置。
背景技术
随着电力行业的不断发展,电力公司逐渐向综合能源服务方向进行转变,精细化的用户用电管理模式逐渐替代了粗放式的用户用电管理模式。
目前,精细化的用户用电管理模式主要通过负荷预测概率建模的方法实现,电力公司通过负荷预测概率建模,预测整个区域内用户用电负荷总量,进行下一个时间段的供电量调节,从而实现精细化的用户用电管理模式。但是,现有技术在进行负荷预测概率建模时,是将一个区域内所有用户建立在同一个模型下,当数据量较大时,覆盖的用户类型较多,用同一个模型预测不同类型用户的用电量,容易导致个体用户预测精度偏低,进而使得预测得到的整体区域的用电负荷总量存在较大的波动性。举个例子,某区域内用户总量是10万,现有技术就会针对这10万个用户统一建立一个模型,但是,这10万个用户可能涉及工业用户和住宅用户,工业用户的用电量与住宅用户的用电量之间显然会很大的差距,如果利用同一个模型进行负荷预测,该模型很难与整个区域内各种类型用户的用电情况实现良好匹配,进而导致电力公司预测的对应区域内的用电负荷总量存在较大的偏差。
基于此,目前亟需一种预测区域用户负荷量的方法,用于解决现有技术中预测某一区域内用户负荷总量精度偏低的问题。
发明内容
本申请提供了一种预测区域用户负荷量的方法,可用于解决在现有技术中预测某一区域内用户负荷总量精度偏低的问题。
第一方面,本申请提供了一种预测区域用电负荷量的方法,所述方法包括:
获取待预测区域内的用户数据;所述用户数据包括待预测用户的典型用电模式、待预测用户的用电行为信息熵、待预测用户的画像特征、待预测用户的天气数据和待预测用户的日期数据;
根据所述待预测用户的典型用电模式、所述待预测用户的用电行为信息熵、所述待预测用户的画像特征,从多个用电类型中确定待预测用户的用电类型;所述多个用电类型是根据样本用户的典型用电模式、样本用户的用电行为信息熵和样本用户的画像特征确定的;
根据所述待预测用户的用电类型,以及各用电类型分别对应的负荷预测概率模型,确定目标负荷预测概率模型;第一负荷预测概率模型是根据第一样本用户的天气数据、第一样本用户的日期数据和第一样本用户的实际用电负荷量数据建立的;所述第一负荷预测概率模型是第一用电类型对应的负荷预测概率模型;所述第一用电类型是各用电类型中任意一个类型;所述第一样本用户是符合所述第一用电类型的样本用户;
将待预测用户的天气数据和待预测用户的日期数据,输入所述目标负荷预测概率模型,得到所述目标负荷预测概率模型的输出结果;
根据所述输出结果,确定所述待预测用户的预测用电负荷量;
根据所述待预测区域内所有待预测用户的预测用电负荷量,确定所述待预测区域的总预测用电负荷量。
结合第一方面,在第一方面的一种可实现方式中,所述第一用电类型对应的负荷预测概率模型具体采用以下方式建立:
将所述第一样本用户的用户数据划分为第一训练数据集、第二训练数据集和测试数据集;所述第一训练数据集包括第一训练样本用户的天气数据、第一训练样本用户的日期数据和第一训练样本用户的实际用电负荷量数据;所述第二训练数据集包括第二训练样本用户的天气数据、第二训练样本用户的日期数据和第二训练样本用户的实际用电负荷量数据;所述测试数据集包括测试样本用户的天气数据、测试样本用户的日期数据和测试样本用户的实际用电负荷量数据;
根据所述第一训练样本用户的天气数据、所述第一训练样本用户的日期数据和所述第一训练样本用户的实际用电负荷量数据,对预设的点预测模型进行训练,得到训练后的点预测模型;
将所述第二训练样本用户的天气数据和所述第二训练样本用户的日期数据,输入所述训练后的点预测模型,得到第二训练样本用户的预测用电负荷量数据;
将所述第二训练样本用户的实际用电负荷量数据与第二训练样本用户的预测用电负荷量数据的差值,作为第二训练样本用户的残差;
根据所述第二训练样本用户的天气数据、所述第二训练样本用户的日期数据、所述第二训练样本用户的预测用电负荷量数据和所述第二训练样本用户的残差,对预设的条件残差预测模型进行训练,得到训练后的条件残差预测模型;
将所述测试样本用户的天气数据和所述测试样本用户的日期数据,输入所述训练后的点预测模型,得到测试样本用户的预测用电负荷量数据;
将所述测试样本用户的天气数据、所述测试样本用户的日期数据以及所述测试样本用户的预测用电负荷量数据,输入所述训练后的条件残差预测模型,得到测试样本用户的残差;
将所述测试样本用户的预测用电负荷量数据与所述测试样本用户的残差所对应的差值,作为测试样本用户的预测用电负荷量;
如果所述测试样本用户的预测用电负荷量和所述测试样本用户的实际用电负荷量数据之间的差值小于预设阈值,则将所述训练后的点预测模型和所述训练后的条件残差预测模型确定为所述第一用电类型对应的负荷预测概率模型。
结合第一方面,在第一方面的一种可实现方式中,所述多个用电类型具体通过以下方式确定:
将所述样本用户数据随机分为多个初始数据集;
针对每个初始数据集,根据所述初始数据集中样本用户的典型用电模式、样本用户的用电行为信息熵和样本用户的画像特征,使用局部聚类模型对样本用户进行局部聚类,得到多个子用电类型;
利用全局聚类模型将所述多个初始数据集分别对应的子用电类型进行全局聚类,得到所述多个用电类型。
结合第一方面,在第一方面的一种可实现方式中,所述待预测用户的典型用电模式具体通过以下方式确定:
获取待预测用户的多种历史用电模式,以及每种历史用电模式的出现次数;
根据所述每种历史用电模式的出现次数以及所有历史用电模式的总出现次数,确定每种历史用电模式的占比;
将占比最高的历史用电模式确定为所述待预测用户的典型用电模式。
结合第一方面,在第一方面的一种可实现方式中,所述待预测用户的画像特征具体通过以下方式确定:
采集待预测用户的问卷信息;所述问卷信息包括用户基本属性、用户用电习惯属性、用户住房属性和用户家庭设备配置属性中的至少一项;
将所述待预测用户的问卷信息进行离散化、归一化和编码化处理,得到所述待预测用户的画像特征。
第二方面,本申请提供了一种预测区域用电负荷量的装置,所述装置包括:
获取模块,用于获取待预测区域内的用户数据;所述用户数据包括待预测用户的典型用电模式、待预测用户的用电行为信息熵、待预测用户的画像特征、待预测用户的天气数据和待预测用户的日期数据;
处理模块,用于根据所述待预测用户的典型用电模式、所述待预测用户的用电行为信息熵、所述待预测用户的画像特征,从多个用电类型中确定待预测用户的用电类型;所述多个用电类型是根据样本用户的典型用电模式、样本用户的用电行为信息熵和样本用户的画像特征确定的;
所述处理模块,还用于根据所述待预测用户的用电类型,以及各用电类型分别对应的负荷预测概率模型,确定目标负荷预测概率模型;第一负荷预测概率模型是根据第一样本用户的天气数据、第一样本用户的日期数据和第一样本用户的实际用电负荷量数据建立的;所述第一负荷预测概率模型是第一用电类型对应的负荷预测概率模型;所述第一用电类型是各用电类型中任意一个类型;所述第一样本用户是符合所述第一用电类型的样本用户;
预测模块,用于将待预测用户的天气数据和待预测用户的日期数据,输入所述目标负荷预测概率模型,得到所述目标负荷预测概率模型的输出结果;以及,用于根据所述输出结果,确定所述待预测用户的预测用电负荷量;以及,用于根据所述待预测区域内所有待预测用户的预测用电负荷量,确定所述待预测区域的总预测用电负荷量。
结合第二方面,在第二方面的一种可实现方式中,所述第一用电类型对应的负荷预测概率模型具体采用以下方式建立:
将所述第一样本用户的用户数据划分为第一训练数据集、第二训练数据集和测试数据集;所述第一训练数据集包括第一训练样本用户的天气数据、第一训练样本用户的日期数据和第一训练样本用户的实际用电负荷量数据;所述第二训练数据集包括第二训练样本用户的天气数据、第二训练样本用户的日期数据和第二训练样本用户的实际用电负荷量数据;所述测试数据集包括测试样本用户的天气数据、测试样本用户的日期数据和测试样本用户的实际用电负荷量数据;
根据所述第一训练样本用户的天气数据、所述第一训练样本用户的日期数据和所述第一训练样本用户的实际用电负荷量数据,对预设的点预测模型进行训练,得到训练后的点预测模型;
将所述第二训练样本用户的天气数据和所述第二训练样本用户的日期数据,输入所述训练后的点预测模型,得到第二训练样本用户的预测用电负荷量数据;
将所述第二训练样本用户的实际用电负荷量数据与第二训练样本用户的预测用电负荷量数据的差值,作为第二训练样本用户的残差;
根据所述第二训练样本用户的天气数据、所述第二训练样本用户的日期数据、所述第二训练样本用户的预测用电负荷量数据和所述第二训练样本用户的残差,对预设的条件残差预测模型进行训练,得到训练后的条件残差预测模型;
将所述测试样本用户的天气数据和所述测试样本用户的日期数据,输入所述训练后的点预测模型,得到测试样本用户的预测用电负荷量数据;
将所述测试样本用户的天气数据、所述测试样本用户的日期数据以及所述测试样本用户的预测用电负荷量数据,输入所述训练后的条件残差预测模型,得到测试样本用户的残差;
将所述测试样本用户的预测用电负荷量数据与所述测试样本用户的残差所对应的差值,作为测试样本用户的预测用电负荷量;
如果所述测试样本用户的预测用电负荷量和所述测试样本用户的实际用电负荷量数据之间的差值小于预设阈值,则将所述训练后的点预测模型和所述训练后的条件残差预测模型确定为所述第一用电类型对应的负荷预测概率模型。
结合第二方面,在第二方面的一种可实现方式中,所述多个用电类型具体通过以下方式确定:
将所述样本用户数据随机分为多个初始数据集;
针对每个初始数据集,根据所述初始数据集中样本用户的典型用电模式、样本用户的用电行为信息熵和样本用户的画像特征,使用局部聚类模型对样本用户进行局部聚类,得到多个子用电类型;
利用全局聚类模型将所述多个初始数据集分别对应的子用电类型进行全局聚类,得到所述多个用电类型。
结合第二方面,在第二方面的一种可实现方式中,所述待预测用户的典型用电模式具体通过以下方式确定:
获取待预测用户的多种历史用电模式,以及每种历史用电模式的出现次数;
根据所述每种历史用电模式的出现次数以及所有历史用电模式的总出现次数,确定每种历史用电模式的占比;
将占比最高的历史用电模式确定为所述待预测用户的典型用电模式。
结合第二方面,在第二方面的一种可实现方式中,所述待预测用户的画像特征具体通过以下方式确定:
采集待预测用户的问卷信息;所述问卷信息包括用户基本属性、用户用电习惯属性、用户住房属性和用户家庭设备配置属性中的至少一项;
将所述待预测用户的问卷信息进行离散化、归一化和编码化处理,得到所述待预测用户的画像特征。
本申请将不同的用户数据进行分组。针对每一组内同类型的用户数据进行建模,保证了建立的模型可以较好的匹配每个用户数据,提高预测区域用户负荷量的精度。同时分组的方法也避免了对每个用户进行建模而可能造成的巨大工作量。本申请提供的方法可以在避免大量工作量的前提下,提高对预测区域用户负荷量的精度。
附图说明
图1为本申请实施例提供的一种预测区域用户负荷量的方法对应的流程示意图;
图2a为本申请实施例提供的待预测用户的典型用电模式示意图之一;
图2b为本申请实施例提供的待预测用户的典型用电模式示意图之二;
图2c为本申请实施例提供的待预测用户的典型用电模式示意图之三;
图3为本申请实施例提供的一种确定多个用电类型的流程示意图;
图4为本申请实施例提供的一种全局聚类后的结果示意图;
图5为本申请实施例提供的一种第一用电类型对应的负荷预测概率模型建立的流程示意图;
图6为本申请实施例提供的一种预测区域用户负荷量的装置的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
电力公司为实现对用户用电的精细化管理,通常会利用建立好的负荷预测概率模型来预估下一时间段内区域内的负荷总量,从而调节发电量,避免能源的浪费。目前,现有技术一般将一个区域内所有用户建立在同一个模型下,但是,即便是在同一个区域内,用户的用电特征也各不相同,单个模型很难与每个用户都匹配。
基于以上问题,本申请实施例提供了一种预测区域用户负荷量的方法。请参考图1,其示例性示出了本申请实施例提供的一种预测区域用户负荷量的方法对应的流程示意图,具体流程如下:
步骤101,获取待预测区域内的用户数据。
步骤102,根据待预测用户的典型用电模式、待预测用户的用电行为信息熵、待预测用户的画像特征,从多个用电类型中确定待预测用户的用电类型。
步骤103,根据待预测用户的用电类型,以及各用电类型分别对应的负荷预测概率模型,确定目标负荷预测概率模型。
步骤104,将待预测用户的天气数据和待预测用户的日期数据,输入目标负荷预测概率模型,得到目标负荷预测概率模型的输出结果。
步骤105,根据输出结果,确定待预测用户的预测用电负荷量。
步骤106,根据待预测区域内所有待预测用户的预测用电负荷量,确定待预测区域的总预测用电负荷量。
本申请实施例将不同的用户数据进行分组。针对每一组内同类型的用户数据进行建模,保证了建立的模型可以较好的匹配每个用户数据,提高预测区域用户负荷量的精度。同时分组的方法也避免了对每个用户进行建模而可能造成的巨大工作量。本申请实施例提供的方法可以在避免大量工作量的前提下,提高对预测区域用户负荷量的精度。
具体的,步骤101中,用户数据包括待预测用户的典型用电模式、待预测用户的用电行为信息熵、待预测用户的画像特征、待预测用户的天气数据和待预测用户的日期数据。
其中,待预测用户的典型用电模式、待预测用户的用电行为信息熵、待预测用户的画像特征进行组合后,构成了待预测用户的特征向量。
下面分别介绍特征向量的各部分的确定方法。
(1)待预测用户的典型用电模式
待预测用户的典型用电模式具体通过以下方式确定:
首先,获取待预测用户的多种历史用电模式,以及每种历史用电模式的出现次数。
然后,根据每种历史用电模式的出现次数以及所有历史用电模式的总出现次数,确定每种历史用电模式的占比。
最后,将占比最高的历史用电模式确定为待预测用户的典型用电模式。
如图2a所示,为本申请实施例提供的待预测用户的典型用电模式示意图之一。
如图2b所示,为本申请实施例提供的待预测用户的典型用电模式示意图之二。
如图2c所示,为本申请实施例提供的待预测用户的典型用电模式示意图之三。
需要说明的是,在本申请具体实施过程中,待预测用户的典型用电模式的种类众多,以上三幅图仅为其中三种的一种示例。由这三幅图可以获知,一般情况下,用户的负荷呈现单高峰形态。一般凌晨用电为低谷阶段。这些规律仅为待预测用户典型用电模式的一般性规律,而各个用户的用电特征各不相同,例如不同待预测用户的典型用电模式中的高峰时间并不相同。
(2)待预测用户的画像特征
待预测用户的画像特征具体通过以下方式确定:
采集待预测用户的问卷信息,以及将待预测用户的问卷信息进行离散化、归一化和编码化处理,得到待预测用户的画像特征。
具体的,问卷信息可以包括多种信息,例如,可以包括用户基本属性、用户用电习惯属性、用户住房属性和用户家庭设备配置属性中的至少一项。其中,用户基本属性可以包括以下至少一种:户主年龄段、户主就业情况和户主社会阶层等。
需要说明的是,问卷信息可以不局限于本申请实施例提供的四种信息,与用户用电情况相关的信息都可以录入问卷信息中。
(3)待预测用户的用电行为信息熵
要确定待预测用户的用电行为信息熵,首先通过以下方式确定待预测用户处于特定用电模式种类下的概率:
Figure BDA0002514500560000061
公式(1)中,
Figure BDA0002514500560000062
为编号为i的用电模式种类在编号为n的待预测用户中出现的概率,即待预测用户处于特定用电模式种类下的概率;n为待预测用户的编号;i为待预测用户的用电模式种类编号;M表示待预测用户的历史用电模式的个数;m表示待预测用户的历史用电模式的编号;I为指示性函数,当满足预设条件时(sm,n=i)即编号为n的待预测用户的第m个历史用电模式恰好为编号为i的用电模式种类所对应的用电模式,则值为1,否则,值为0;
结合公式(1),待预测用户的用电行为信息熵具体通过以下方式确定:
Figure BDA0002514500560000063
公式(2)中,E(n)为编号为n的待预测用户的用电行为信息熵;
Figure BDA0002514500560000064
为编号为i的用电模式种类在编号为n的待预测用户中出现的概率;S为用电模式种类的数目。如果当i为任意值时,
Figure BDA0002514500560000065
取值均为1/S,则此时待预测用户的用电行为多变,对应的E(n)最大;如果当i为某一值时,
Figure BDA0002514500560000066
取值为1,则此时待预测用户的用电行为最稳定,对应的E(n)最小,取值为0。
在确定了待预测用户的典型用电模式、待预测用户的用电行为信息熵、待预测用户的画像特征之后,将三者组合后得到待预测用户的特征向量。
步骤102中,多个用电类型是根据样本用户的典型用电模式、样本用户的用电行为信息熵和样本用户的画像特征确定的。
具体的,如图3所示为本申请实施例提供的一种确定多个用电类型的流程示意图,具体包括以下步骤:
步骤301,将样本用户数据随机分为多个初始数据集。
具体的,每个初始数据集可能含有一种或多种用电类型的样本用户。
步骤302,针对每个初始数据集,根据初始数据集中样本用户的典型用电模式、样本用户的用电行为信息熵和样本用户的画像特征,使用局部聚类模型对样本用户进行局部聚类,得到多个子用电类型。
在此处可以采用多种局部聚类方法,一种可行的方法为K-means聚类算法。
步骤303,利用全局聚类模型将多个初始数据集分别对应的子用电类型进行全局聚类,得到多个用电类型。
如图4所示本申请实施例提供的一种全局聚类后的结果示意图。从图中可知,同一个用电类型的样本用户基本聚集在一起,不同用电类型的样本用户归属于不同的用电类型。
如表1所示,为不同用电类型下样本用户的部分数据的一种示例。其中,用电类型编号为1的样本用户的数量为1752,对应的用户行为信息熵均值为2.821,对应的典型用电模式均值为1.031,对应的户主年龄段均值(画像特征之一)为4.531,对应的户主就业情况均值(画像特征之二)为3.513。具体可以参考表1示出的内容,此处不再一一赘述。
表1:不同用电类型下样本用户的部分数据的一种示例
Figure BDA0002514500560000071
根据表1可以看出,不同用电类型的用户数存在较大差异,对应的样本用户的数据也存在较大的差异。如果将所有的数据使用同一模型进行预测,必然导致预测数据的精准度偏低。
步骤103中,各用电类型分别对应的负荷预测概率模型在进行预测前已经通过训练得到。
以第一负荷预测概率模型为例,第一负荷预测概率模型是根据第一样本用户的天气数据、第一样本用户的日期数据和第一样本用户的实际用电负荷量数据建立的。第一负荷预测概率模型是第一用电类型对应的负荷预测概率模型。第一用电类型是各用电类型中任意一个类型;第一样本用户是符合第一用电类型的样本用户。
需要说明的是,此处的“第一”仅为了区分类型所做的编号,类似的内容可以用“第二”、“第三”等表示。
具体请参考图5,其示例性的示出了本申请实施例提供的一种第一用电类型对应的负荷预测概率模型建立的流程示意图,具体包括以下步骤:
步骤501,将第一样本用户的用户数据划分为第一训练数据集、第二训练数据集和测试数据集。
其中,测试数据集中的第一样本用户的数目大概占第一样本用户总数目的百分之二十左右。
具体的,第一训练数据集包括第一训练样本用户的天气数据、第一训练样本用户的日期数据和第一训练样本用户的实际用电负荷量数据;第二训练数据集包括第二训练样本用户的天气数据、第二训练样本用户的日期数据和第二训练样本用户的实际用电负荷量数据;测试数据集包括测试样本用户的天气数据、测试样本用户的日期数据和测试样本用户的实际用电负荷量数据。
步骤502,根据第一训练样本用户的天气数据、第一训练样本用户的日期数据和第一训练样本用户的实际用电负荷量数据,对预设的点预测模型进行训练,得到训练后的点预测模型。
具体的,对预设的点预测模型进行训练,得到点预测模型的参数,点预测模型的参数可以最佳地拟合第一训练样本用户的实际用电负荷量数据。根据点预测模型的参数,可以确定训练后的点预测模型。
步骤503,将第二训练样本用户的天气数据和第二训练样本用户的日期数据,输入训练后的点预测模型,得到第二训练样本用户的预测用电负荷量数据。
具体的,第二训练样本用户的预测用电负荷量数据通过以下方式确定:
Figure BDA0002514500560000081
公式(3)中,
Figure BDA0002514500560000082
为预测用电负荷量数据,在步骤503中体现为第二训练样本用户的预测用电负荷量数据;f为点预测模型;W为点预测模型的参数;Xt为天气数据和日期数据对应的输入向量,在步骤503中体现为第二训练样本用户的天气数据和第二训练样本用户的日期数据。
步骤504,将第二训练样本用户的实际用电负荷量数据与第二训练样本用户的预测用电负荷量数据的差值,作为第二训练样本用户的残差。
步骤505,根据第二训练样本用户的天气数据、第二训练样本用户的日期数据、第二训练样本用户的预测用电负荷量数据和第二训练样本用户的残差,对预设的条件残差预测模型进行训练,得到训练后的条件残差预测模型。
具体的,本申请实施例在对预设的条件残差预测模型进行训练时,使用的是分位数回归模型,而没有采用现有技术中常用的正态分布等模型。分位数回归模型可以更精准地体现对残差的表达能力。
步骤506,将测试样本用户的天气数据和测试样本用户的日期数据,输入训练后的点预测模型,得到测试样本用户的预测用电负荷量数据。
具体的,测试样本用户的预测用电负荷量数据根据公式(3)可以确定。
步骤507,将测试样本用户的天气数据、测试样本用户的日期数据以及测试样本用户的预测用电负荷量数据,输入训练后的条件残差预测模型,得到测试样本用户的残差。
具体的,测试样本用户的残差通过以下方式确定:
Figure BDA0002514500560000083
公式(4)中,εt,q为预估残差,在步骤507中体现为测试样本用户的残差;gq为分位数回归模型(即条件残差预测模型);Wq为分位数回归模型的参数;Xt为天气数据和日期数据对应的输入向量,在步骤507中体现为测试样本用户的天气数据和测试样本用户的日期数据;
Figure BDA0002514500560000084
为预测用电负荷量数据,在步骤507中体现为测试样本用户的预测用电负荷量数据。
步骤508,将测试样本用户的预测用电负荷量数据与测试样本用户的残差所对应的差值,作为测试样本用户的预测用电负荷量。
具体的,测试样本用户的预测用电负荷量通过以下方式确定:
Figure BDA0002514500560000091
公式(5)中,
Figure BDA0002514500560000092
为最终预测用电负荷量,步骤508中体现为测试样本用户的预测用电负荷量;
Figure BDA0002514500560000093
为预测用电负荷量数据,步骤508中体现为测试样本用户的预测用电负荷量数据;εt,q为预估残差,步骤508中体现为测试样本用户的残差。
步骤509,如果测试样本用户的预测用电负荷量和测试样本用户的实际用电负荷量数据之间的差值小于预设阈值,则将训练后的点预测模型和训练后的条件残差预测模型确定为第一用电类型对应的负荷预测概率模型。
如果测试样本用户的预测用电负荷量和测试样本用户的实际用电负荷量数据之间的差值大于或等于预设阈值,则需要调整训练后的点预测模型和训练后的条件残差预测模型,直至测试样本用户的预测用电负荷量和测试样本用户的实际用电负荷量数据之间的差值小于预设阈值。
通过步骤501至步骤509,可以获取多个负荷预测概率模型,每一个负荷预测概率模型对应一个用电类型。输入待预测用户的用电类型,匹配得到目标负荷预测概率模型,目标负荷预测概率模型所对应的用电类型与待预测用户的用电类型最为接近。
步骤104至步骤106中,如上文所述,本申请实施例中,目标负荷预测概率模型可以包括训练好的点预测模型和训练好的条件残差预测模型。
基于此,在进行用电负荷量预测时,可以先将待预测用户的天气数据和待预测用户的日期数据输入训练好的点预测模型,得到点预测模型的输出结果;然后,将待预测用户的天气数据、待预测用户的日期数据,以及点预测模型的输出结果输入到训练好的条件残差预测模型,得到条件残差预测模型的输出结果;最后,根据点预测模型的输出结果和条件残差预测模型的输出结果之间的差值,确定目标负荷预测概率模型的输出结果。
进而,可以将目标负荷预测概率模型的输出结果作为待预测用户的预测用电负荷量。
当所有待预测用户的用电负荷量都预测到之后,可以将同一类型下所有的待预测用户的预测用电负荷量相加,得到同一类型的待预测用户所组成的聚集的负荷总量;然后再将不同类型的聚集的负荷总量相加,得到待预测区域的总预测用电负荷量。
需要说明的是,在步骤505中,对预设的条件残差预测模型进行训练时,使用的是分位数回归模型,所以条件残差预测模型的输出结果的输出结果也为q分位数的表现形式,这就造成目标负荷预测概率模型的输出结果也是q分位数的表现形式。
还需要说明的是,由于目标负荷预测概率模型的输出结果是q分位数的表现形式,因此,可以根据需要选取合适的预测用电负荷量,即,可以将概率最大处的负荷量作为最后的预测用电负荷量,也可将概率为80%处的负荷量作为最后的预测用电负荷量,还可以根据需要,选取一段负荷区间,作为最后的预测用电负荷量。不同的选取方式可以为电力公司提供不同的调整方案。例如选取概率最大处的负荷量最为最后的预测用电负荷量,可以确定电力公司的所需的发电量上限。再例如选取一段负荷区间,可以预估电力公司所需提供发电量的区间。
根据步骤101至步骤106,本申请方法实施例可以得到待预测区域的总预测用电负荷量。为了验证本申请方法实施例的效果,下面使用两个模型与本申请实施例做对比。
对比模型1采用的方法是,使用同一模型对所有待预测用户进行预测。
对比模型2采用的方法是,对每个用户训练不同的模型进行预测。
平均绝对百分误差(Mean Absolute Percentage Error,MAPE)和分位数得分(Quantile Score,QS)是衡量预测精度的通用指标,且MAPE和QS的值越低,代表预测精度越高。
如表2所示,为三种模型的单个用户负荷量预测精度。其中,使用本申请实施例所用模型对用户1进行预测后,所获取的MAPE值为4.91%,所获取的QS值为0.146;使用对比模型1对用户1进行预测后,所获取的MAPE值为5.65%,所获取的QS值为0.167;使用对比模型2对用户1进行预测后,所获取的MAPE值为5.74%,所获取的QS值为0.179。具体可以参考表2示出的内容,此处不再一一赘述。
表2:三种模型的单个用户负荷量预测精度
用户1 用户2 用户3
本申请实施例所用模型的MAPE值 4.91% 3.95% 4.23%
本申请实施例所用模型的QS值 0.146 0.104 0.124
对比模型1的MAPE值 5.65% 6.15% 5.30%
对比模型1的QS值 0.167 0.189 0.156
对比模型2的MAPE值 5.74% 4.92% 5.28%
对比模型2的QS值 0.179 0.145 0.161
从表2可以看到,使用本申请实施例所提供的的模型对单个用户进行预测,预测精度均高于使用对比模型1或者对比模型2的预测精度,由此可以知本申请实施例提供的目标负荷预测概率模型可以保证预测的精准度。
下述为本申请装置实施例,可以用于执行本申请方法实施例。对于本申请装置实施例中未披露的细节,请参照本申请方法实施例。
图6示例性示出了本申请实施例提供的一种预测区域用户负荷量的装置的结构示意图。如图6所示,该装置具有实现上述预测区域用户负荷量的方法的功能,所述功能可以由硬件实现,也可以由硬件执行相应的软件实现。该装置可以包括:获取模块601、处理模块602和预测模块603。
获取模块601,用于获取待预测区域内的用户数据;用户数据包括待预测用户的典型用电模式、待预测用户的用电行为信息熵、待预测用户的画像特征、待预测用户的天气数据和待预测用户的日期数据。
处理模块602,用于根据待预测用户的典型用电模式、待预测用户的用电行为信息熵、待预测用户的画像特征,从多个用电类型中确定待预测用户的用电类型;多个用电类型是根据样本用户的典型用电模式、样本用户的用电行为信息熵和样本用户的画像特征确定的。
处理模块602,还用于根据待预测用户的用电类型,以及各用电类型分别对应的负荷预测概率模型,确定目标负荷预测概率模型;第一负荷预测概率模型是根据第一样本用户的天气数据、第一样本用户的日期数据和第一样本用户的实际用电负荷量数据建立的;第一负荷预测概率模型是第一用电类型对应的负荷预测概率模型;第一用电类型是各用电类型中任意一个类型;第一样本用户是符合第一用电类型的样本用户。
预测模块603,用于将待预测用户的天气数据和待预测用户的日期数据,输入目标负荷预测概率模型,得到目标负荷预测概率模型的输出结果;以及,用于根据输出结果,确定待预测用户的预测用电负荷量;以及,用于根据待预测区域内所有待预测用户的预测用电负荷量,确定待预测区域的总预测用电负荷量。
可选的,第一用电类型对应的负荷预测概率模型具体采用以下方式建立:
将第一样本用户的用户数据划分为第一训练数据集、第二训练数据集和测试数据集;第一训练数据集包括第一训练样本用户的天气数据、第一训练样本用户的日期数据和第一训练样本用户的实际用电负荷量数据;第二训练数据集包括第二训练样本用户的天气数据、第二训练样本用户的日期数据和第二训练样本用户的实际用电负荷量数据;测试数据集包括测试样本用户的天气数据、测试样本用户的日期数据和测试样本用户的实际用电负荷量数据。
根据第一训练样本用户的天气数据、第一训练样本用户的日期数据和第一训练样本用户的实际用电负荷量数据,对预设的点预测模型进行训练,得到训练后的点预测模型。
将第二训练样本用户的天气数据和第二训练样本用户的日期数据,输入训练后的点预测模型,得到第二训练样本用户的预测用电负荷量数据。
将第二训练样本用户的实际用电负荷量数据与第二训练样本用户的预测用电负荷量数据的差值,作为第二训练样本用户的残差。
根据第二训练样本用户的天气数据、第二训练样本用户的日期数据、第二训练样本用户的预测用电负荷量数据和第二训练样本用户的残差,对预设的条件残差预测模型进行训练,得到训练后的条件残差预测模型。
将测试样本用户的天气数据和测试样本用户的日期数据,输入训练后的点预测模型,得到测试样本用户的预测用电负荷量数据。
将测试样本用户的天气数据、测试样本用户的日期数据以及测试样本用户的预测用电负荷量数据,输入训练后的条件残差预测模型,得到测试样本用户的残差。
将测试样本用户的预测用电负荷量数据与测试样本用户的残差所对应的差值,作为测试样本用户的预测用电负荷量。
如果测试样本用户的预测用电负荷量和测试样本用户的实际用电负荷量数据之间的差值小于预设阈值,则将训练后的点预测模型和训练后的条件残差预测模型确定为第一用电类型对应的负荷预测概率模型。
可选的,多个用电类型具体通过以下方式确定:
将样本用户数据随机分为多个初始数据集;
针对每个初始数据集,根据初始数据集中样本用户的典型用电模式、样本用户的用电行为信息熵和样本用户的画像特征,使用局部聚类模型对样本用户进行局部聚类,得到多个子用电类型。
利用全局聚类模型将多个初始数据集分别对应的子用电类型进行全局聚类,得到多个用电类型。
可选的,待预测用户的典型用电模式具体通过以下方式确定:
获取待预测用户的多种历史用电模式,以及每种历史用电模式的出现次数。
根据每种历史用电模式的出现次数以及所有历史用电模式的总出现次数,确定每种历史用电模式的占比。
将占比最高的历史用电模式确定为待预测用户的典型用电模式。
可选的,待预测用户的画像特征具体通过以下方式确定:
采集待预测用户的问卷信息;问卷信息包括用户基本属性、用户用电习惯属性、用户住房属性和用户家庭设备配置属性中的至少一项。
将待预测用户的问卷信息进行离散化、归一化和编码化处理,得到待预测用户的画像特征。
本申请实施例将不同的用户数据进行分组。针对每一组内同类型的用户数据进行建模,保证了建立的模型可以较好的匹配每个用户数据,提高预测区域用户负荷量的精度。同时分组的方法也避免了对每个用户进行建模而可能造成的巨大工作量。本申请实施例提供的方法可以在避免大量工作量的前提下,提高对预测区域用户负荷量的精度。
本发明可用于众多通用或专用的计算系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。
本发明可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本发明,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本发明旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本发明未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

Claims (6)

1.一种预测区域用户负荷量的方法,其特征在于,所述方法包括:
获取待预测区域内的用户数据;所述用户数据包括待预测用户的典型用电模式、待预测用户的用电行为信息熵、待预测用户的画像特征、待预测用户的天气数据和待预测用户的日期数据;
根据所述待预测用户的典型用电模式、所述待预测用户的用电行为信息熵、所述待预测用户的画像特征,从多个用电类型中确定待预测用户的用电类型;所述多个用电类型是根据样本用户的典型用电模式、样本用户的用电行为信息熵和样本用户的画像特征确定的;
根据所述待预测用户的用电类型,以及各用电类型分别对应的负荷预测概率模型,确定目标负荷预测概率模型;第一负荷预测概率模型是根据第一样本用户的天气数据、第一样本用户的日期数据和第一样本用户的实际用电负荷量数据建立的;所述第一负荷预测概率模型是第一用电类型对应的负荷预测概率模型;所述第一用电类型是各用电类型中任意一个类型;所述第一样本用户是符合所述第一用电类型的样本用户;
将待预测用户的天气数据和待预测用户的日期数据,输入所述目标负荷预测概率模型,得到所述目标负荷预测概率模型的输出结果;
根据所述输出结果,确定所述待预测用户的预测用电负荷量;
根据所述待预测区域内所有待预测用户的预测用电负荷量,确定所述待预测区域的总预测用电负荷量;
所述第一用电类型对应的负荷预测概率模型具体采用以下方式建立:
将所述第一样本用户的用户数据划分为第一训练数据集、第二训练数据集和测试数据集;所述第一训练数据集包括第一训练样本用户的天气数据、第一训练样本用户的日期数据和第一训练样本用户的实际用电负荷量数据;所述第二训练数据集包括第二训练样本用户的天气数据、第二训练样本用户的日期数据和第二训练样本用户的实际用电负荷量数据;所述测试数据集包括测试样本用户的天气数据、测试样本用户的日期数据和测试样本用户的实际用电负荷量数据;
根据所述第一训练样本用户的天气数据、所述第一训练样本用户的日期数据和所述第一训练样本用户的实际用电负荷量数据,对预设的点预测模型进行训练,得到训练后的点预测模型;
将所述第二训练样本用户的天气数据和所述第二训练样本用户的日期数据,输入所述训练后的点预测模型,得到第二训练样本用户的预测用电负荷量数据;
将所述第二训练样本用户的实际用电负荷量数据与第二训练样本用户的预测用电负荷量数据的差值,作为第二训练样本用户的残差;
根据所述第二训练样本用户的天气数据、所述第二训练样本用户的日期数据、所述第二训练样本用户的预测用电负荷量数据和所述第二训练样本用户的残差,对预设的条件残差预测模型进行训练,得到训练后的条件残差预测模型;
将所述测试样本用户的天气数据和所述测试样本用户的日期数据,输入所述训练后的点预测模型,得到测试样本用户的预测用电负荷量数据;
将所述测试样本用户的天气数据、所述测试样本用户的日期数据以及所述测试样本用户的预测用电负荷量数据,输入所述训练后的条件残差预测模型,得到测试样本用户的残差;
将所述测试样本用户的预测用电负荷量数据与所述测试样本用户的残差所对应的差值,作为测试样本用户的预测用电负荷量;
如果所述测试样本用户的预测用电负荷量和所述测试样本用户的实际用电负荷量数据之间的差值小于预设阈值,则将所述训练后的点预测模型和所述训练后的条件残差预测模型确定为所述第一用电类型对应的负荷预测概率模型;
所述多个用电类型具体通过以下方式确定:
将样本用户数据随机分为多个初始数据集;
针对每个初始数据集,根据所述初始数据集中样本用户的典型用电模式、样本用户的用电行为信息熵和样本用户的画像特征,使用局部聚类模型对样本用户进行局部聚类,得到多个子用电类型;
利用全局聚类模型将所述多个初始数据集分别对应的子用电类型进行全局聚类,得到所述多个用电类型。
2.根据权利要求1所述的方法,其特征在于,所述待预测用户的典型用电模式具体通过以下方式确定:
获取待预测用户的多种历史用电模式,以及每种历史用电模式的出现次数;
根据所述每种历史用电模式的出现次数以及所有历史用电模式的总出现次数,确定每种历史用电模式的占比;
将占比最高的历史用电模式确定为所述待预测用户的典型用电模式。
3.根据权利要求1所述的方法,其特征在于,所述待预测用户的画像特征具体通过以下方式确定:
采集待预测用户的问卷信息;所述问卷信息包括用户基本属性、用户用电习惯属性、用户住房属性和用户家庭设备配置属性中的至少一项;
将所述待预测用户的问卷信息进行离散化、归一化和编码化处理,得到所述待预测用户的画像特征。
4.一种预测区域用户负荷量的装置,其特征在于,所述装置包括:
获取模块,用于获取待预测区域内的用户数据;所述用户数据包括待预测用户的典型用电模式、待预测用户的用电行为信息熵、待预测用户的画像特征、待预测用户的天气数据和待预测用户的日期数据;
处理模块,用于根据所述待预测用户的典型用电模式、所述待预测用户的用电行为信息熵、所述待预测用户的画像特征,从多个用电类型中确定待预测用户的用电类型;所述多个用电类型是根据样本用户的典型用电模式、样本用户的用电行为信息熵和样本用户的画像特征确定的;
所述处理模块,还用于根据所述待预测用户的用电类型,以及各用电类型分别对应的负荷预测概率模型,确定目标负荷预测概率模型;第一负荷预测概率模型是根据第一样本用户的天气数据、第一样本用户的日期数据和第一样本用户的实际用电负荷量数据建立的;所述第一负荷预测概率模型是第一用电类型对应的负荷预测概率模型;所述第一用电类型是各用电类型中任意一个类型;所述第一样本用户是符合所述第一用电类型的样本用户;
预测模块,用于将待预测用户的天气数据和待预测用户的日期数据,输入所述目标负荷预测概率模型,得到所述目标负荷预测概率模型的输出结果;以及,用于根据所述输出结果,确定所述待预测用户的预测用电负荷量;以及,用于根据所述待预测区域内所有待预测用户的预测用电负荷量,确定所述待预测区域的总预测用电负荷量;
所述第一用电类型对应的负荷预测概率模型具体采用以下方式建立:
将所述第一样本用户的用户数据划分为第一训练数据集、第二训练数据集和测试数据集;所述第一训练数据集包括第一训练样本用户的天气数据、第一训练样本用户的日期数据和第一训练样本用户的实际用电负荷量数据;所述第二训练数据集包括第二训练样本用户的天气数据、第二训练样本用户的日期数据和第二训练样本用户的实际用电负荷量数据;所述测试数据集包括测试样本用户的天气数据、测试样本用户的日期数据和测试样本用户的实际用电负荷量数据;
根据所述第一训练样本用户的天气数据、所述第一训练样本用户的日期数据和所述第一训练样本用户的实际用电负荷量数据,对预设的点预测模型进行训练,得到训练后的点预测模型;
将所述第二训练样本用户的天气数据和所述第二训练样本用户的日期数据,输入所述训练后的点预测模型,得到第二训练样本用户的预测用电负荷量数据;
将所述第二训练样本用户的实际用电负荷量数据与第二训练样本用户的预测用电负荷量数据的差值,作为第二训练样本用户的残差;
根据所述第二训练样本用户的天气数据、所述第二训练样本用户的日期数据、所述第二训练样本用户的预测用电负荷量数据和所述第二训练样本用户的残差,对预设的条件残差预测模型进行训练,得到训练后的条件残差预测模型;
将所述测试样本用户的天气数据和所述测试样本用户的日期数据,输入所述训练后的点预测模型,得到测试样本用户的预测用电负荷量数据;
将所述测试样本用户的天气数据、所述测试样本用户的日期数据以及所述测试样本用户的预测用电负荷量数据,输入所述训练后的条件残差预测模型,得到测试样本用户的残差;
将所述测试样本用户的预测用电负荷量数据与所述测试样本用户的残差所对应的差值,作为测试样本用户的预测用电负荷量;
如果所述测试样本用户的预测用电负荷量和所述测试样本用户的实际用电负荷量数据之间的差值小于预设阈值,则将所述训练后的点预测模型和所述训练后的条件残差预测模型确定为所述第一用电类型对应的负荷预测概率模型;
所述多个用电类型具体通过以下方式确定:
将样本用户数据随机分为多个初始数据集;
针对每个初始数据集,根据所述初始数据集中样本用户的典型用电模式、样本用户的用电行为信息熵和样本用户的画像特征,使用局部聚类模型对样本用户进行局部聚类,得到多个子用电类型;
利用全局聚类模型将所述多个初始数据集分别对应的子用电类型进行全局聚类,得到所述多个用电类型。
5.根据权利要求4所述的装置,其特征在于,所述待预测用户的典型用电模式具体通过以下方式确定:
获取待预测用户的多种历史用电模式,以及每种历史用电模式的出现次数;
根据所述每种历史用电模式的出现次数以及所有历史用电模式的总出现次数,确定每种历史用电模式的占比;
将占比最高的历史用电模式确定为所述待预测用户的典型用电模式。
6.根据权利要求4所述的装置,其特征在于,所述待预测用户的画像特征具体通过以下方式确定:
采集待预测用户的问卷信息;所述问卷信息包括用户基本属性、用户用电习惯属性、用户住房属性和用户家庭设备配置属性中的至少一项;
将所述待预测用户的问卷信息进行离散化、归一化和编码化处理,得到所述待预测用户的画像特征。
CN202010471759.3A 2020-05-29 2020-05-29 一种预测区域用户负荷量的方法及装置 Active CN111612275B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010471759.3A CN111612275B (zh) 2020-05-29 2020-05-29 一种预测区域用户负荷量的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010471759.3A CN111612275B (zh) 2020-05-29 2020-05-29 一种预测区域用户负荷量的方法及装置

Publications (2)

Publication Number Publication Date
CN111612275A CN111612275A (zh) 2020-09-01
CN111612275B true CN111612275B (zh) 2022-04-01

Family

ID=72201600

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010471759.3A Active CN111612275B (zh) 2020-05-29 2020-05-29 一种预测区域用户负荷量的方法及装置

Country Status (1)

Country Link
CN (1) CN111612275B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112070307B (zh) * 2020-09-10 2023-01-20 云南电网有限责任公司电力科学研究院 一种区域内能源负荷量的预测方法及装置
CN112330017B (zh) * 2020-11-04 2025-01-07 上海博辕信息技术服务有限公司 电力负荷预测方法、装置、电子设备和存储介质
CN112769135B (zh) * 2021-03-26 2022-07-29 中国电力科学研究院有限公司 一种用于对用电单元进行功率调节的方法及系统
CN113193556B (zh) * 2021-05-12 2023-02-03 燕山大学 基于概率预测模型的短期风电功率预测方法
CN113762601A (zh) * 2021-08-12 2021-12-07 北京市燃气集团有限责任公司 一种燃气用户用气量预测方法及装置
CN114117902A (zh) * 2021-11-19 2022-03-01 新奥数能科技有限公司 新用户负荷预测模型构建方法、装置、设备及存储介质
CN114841832B (zh) * 2022-07-04 2023-01-24 国网湖北省电力有限公司营销服务中心(计量中心) 一种基于用电负荷二次聚类的电力用户画像标签建立方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9432901B1 (en) * 2015-07-24 2016-08-30 Cisco Technology, Inc. System and method to facilitate radio access point load prediction in a network environment
CN105989420A (zh) * 2015-02-12 2016-10-05 西门子公司 确定用户用电行为特征的方法、用户用电负荷的预测方法和装置
CN106096805A (zh) * 2016-05-10 2016-11-09 华北电力大学 一种基于熵权法特征选择的居民用电负荷分类方法
CN108062560A (zh) * 2017-12-04 2018-05-22 贵州电网有限责任公司电力科学研究院 一种基于随机森林的电力用户特征识别分类方法
CN109815994A (zh) * 2019-01-04 2019-05-28 国网山西省电力公司长治供电公司 一种用户用电负荷特征分析方法
CN109886449A (zh) * 2018-12-30 2019-06-14 国网浙江省电力有限公司衢州供电公司 一种基于用户用电行为的地区电网负荷预测方法
CN110674993A (zh) * 2019-09-26 2020-01-10 广东电网有限责任公司 一种用户负荷短期预测方法和装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105989420A (zh) * 2015-02-12 2016-10-05 西门子公司 确定用户用电行为特征的方法、用户用电负荷的预测方法和装置
US9432901B1 (en) * 2015-07-24 2016-08-30 Cisco Technology, Inc. System and method to facilitate radio access point load prediction in a network environment
CN106096805A (zh) * 2016-05-10 2016-11-09 华北电力大学 一种基于熵权法特征选择的居民用电负荷分类方法
CN108062560A (zh) * 2017-12-04 2018-05-22 贵州电网有限责任公司电力科学研究院 一种基于随机森林的电力用户特征识别分类方法
CN109886449A (zh) * 2018-12-30 2019-06-14 国网浙江省电力有限公司衢州供电公司 一种基于用户用电行为的地区电网负荷预测方法
CN109815994A (zh) * 2019-01-04 2019-05-28 国网山西省电力公司长治供电公司 一种用户用电负荷特征分析方法
CN110674993A (zh) * 2019-09-26 2020-01-10 广东电网有限责任公司 一种用户负荷短期预测方法和装置

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
an orderly power utilization scheme based on an imtelligent multi-agent apanage management system;ruijiu jin等;《energies》;20191129(第12期);第1-21页 *
clustering by fast search and find of density peaks;alex rodriguez等;《science》;20140627;第344卷(第6191期);第1492-1496页 *
地市级地区短期负荷分类预测方法的研究;武星辰;《中国优秀硕士学位论文全文数据库 工程科技II辑》;20180315(第03期);C042-1528 *
智能用电用户行为分析的聚类优选策略;龚钢军等;《电力系统自动化》;20180125;第42卷(第2期);第58-63页 *
结合多重聚类和分层聚类的超短期风电功率预测方法;彭晨宇等;《电力系统自动化》;20200125;第44卷(第2期);第173-180页 *

Also Published As

Publication number Publication date
CN111612275A (zh) 2020-09-01

Similar Documents

Publication Publication Date Title
CN111612275B (zh) 一种预测区域用户负荷量的方法及装置
Su et al. A systematic data-driven Demand Side Management method for smart natural gas supply systems
CN111199016A (zh) 一种基于DTW的改进K-means的日负荷曲线聚类方法
CN102819772B (zh) 电力配网建设物资需求预测方法及装置
Liu et al. Wind‐thermal dynamic economic emission dispatch with a hybrid multi‐objective algorithm based on wind speed statistical analysis
CN113255973A (zh) 电力负荷预测方法、装置、计算机设备和存储介质
Xie et al. An integrated Gaussian process modeling framework for residential load prediction
CN106022614A (zh) 一种基于最近邻聚类的神经网络数据挖掘方法
CN102831489A (zh) 电力配网建设物资需求预测方法及装置
Yu et al. An efficient substation placement and sizing strategy based on GIS using semi-supervised learning
CN117744916A (zh) 储能容量的预测方法、装置、计算机设备及可读存储介质
Khuntia et al. Risk‐based security assessment of transmission line overloading considering spatio‐temporal dependence of load and wind power using vine copula
Kim et al. Short-term electric load forecasting using data mining technique
Sari et al. Statistical reliability of wind power scenarios and stochastic unit commitment cost
CN113487080A (zh) 一种基于风速分类的风速动态场景生成方法、系统及终端
CN109583086A (zh) 配电变压器重过载预测方法及终端设备
CN115358476A (zh) 需求响应潜力预测方法、装置、计算机设备和存储介质
CN111080489A (zh) 一种负荷趋势预测方法、系统以及设备
CN112508254B (zh) 变电站工程项目投资预测数据的确定方法
CN114186733A (zh) 一种短期负荷预测方法和装置
CN113887809A (zh) 双碳目标下配电网供需平衡方法、系统、介质及计算设备
Ferraz et al. Analysis of distribution system considering load uncertainties: A k-means clustering approach
CN118735161A (zh) 能源可调能力的确定方法和装置
CN118228069A (zh) 用电负荷预测方法、装置、设备、介质和程序产品
CN111145045A (zh) 一种考虑VaR的电力大用户柔性负荷评估方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant