发明内容
本发明的目的是提供一种基于模糊聚类和支持向量回归的非侵入式负荷监测方法,对目前电网环境环境下的智能电表监测数据进行负荷分解,模型操作简单,在提高负荷分解准确率的同时,降低了计算成本。
为实现上述目的,本发明提供了如下方案:
一种基于模糊聚类和支持向量回归的非侵入式负荷监测方法,该方法包括如下步骤:
步骤1,测量设定时间段内所有负荷的运行功率,提取负荷特征集;
步骤2,对监测总功率序列中的功率值进行模糊聚类,选定中心点值最大的聚类,构建待分解的总功率序列;
步骤3,基于负荷特征集,提取各负荷的特征序列,比较待分解的总功率序列与各负荷的特征序列之间的距离,识别出最大贡献负荷;
步骤4,采用支持向量回归对最大贡献负荷的功率值进行估计;
步骤5,将最大贡献负荷的功率值从原监测总功率序列中减去,并进行误差校验;
步骤6,重复步骤2到步骤5,直到所有负荷分解完成。
可选的,所述步骤1,测量设定时间段内所有负荷的运行功率,提取负荷特征集,具体包括:
在设定时间段T内,获取各负荷运行的功率值组成训练数据库DT;
从训练数据库中提取每种负荷的运行曲线通过减去阈值的方式进行去噪处理后构成负荷特征集S={Si}。
可选的,所述步骤2,对监测总功率序列中的功率值进行模糊聚类,选定中心点值最大的聚类,构建待分解的总功率序列,具体包括:
对监测总功率序列P中的功率值进行模糊聚类;
中心值最大的聚类中的功率值被提取后,其它值均设置为0得到待分解的总功率序列Aj。
可选的,所述步骤3,基于负荷特征集,提取各负荷的特征序列,比较待分解的总功率序列与各负荷的特征序列之间的距离,识别出最大贡献负荷,具体包括:
基于负荷特征集,提取各负荷的特征序列Si;
计算待分解的总功率序列Aj与各负荷的特征序列Si之间的距离,如下:
D(Aj,Si)=DTW(Aj,Si);
选取距离最短的特征序列对应的负荷作为当前最大贡献负荷。
可选的,所述步骤4,采用支持向量回归对最大贡献负荷的功率值进行估计,具体包括:
步骤4.1,将负荷特征集按照运行周期进行分割,用作功率值估计的训练数据;
步骤4.2,使用遗传算法对支持向量回归算法的c和g参数进行优化,得到优化的支持向量回归模型;
步骤4.3,使用功率做为唯一特征,采用优化的支持向量回归模型进行最大贡献负荷的功率值估计,处理为与P等长的序列Aj'。
可选的,所述步骤5,将最大贡献负荷的功率值从原监测总功率序列中减去,并进行误差校验,具体包括:
步骤5.1,按照下式计算不包括当前最大贡献负荷运行的新的总功率序列:
P=P-Aj'
步骤5.2,对当前新的总功率序列进行误差校验,考虑以下三种情况:
第一,检查当前新的总功率序列,若功率值出现负值,认为有估计误差,将该值设置为前后两个功率值的平均值,并反过去调整支持向量回归算法估计的功率值;
第二,如果聚类后获得的子序列短于特征中对应负荷的子序列,认为有估计误差,将错误的聚类功率值调整为该聚类邻居的中心值,并补偿先前的功率估计;
第三,标识为同一负荷的多个同时运行状态的值被认为是估计误差,重新将最大贡献负荷识别为距离与Aj次近的负荷。
可选的,所述步骤6中,重复步骤2到步骤5,直到所有负荷分解完成,具体为:
迭代进行步骤2到步骤5的过程,直至只剩恒运行负荷为止,所述恒运行负荷指的是在运行期间功率无明显变化的负荷。
根据本发明提供的具体实施例,本发明公开了以下技术效果:本发明提供的基于模糊聚类和支持向量回归的非侵入式负荷监测方法,采用模糊聚类识别对功率贡献最大的负荷,支持向量回归方法可对功率贡献最大的负荷运行期间的功率值进行估计,算法提出基础是贡献最大的负荷的功率序列与监测总功率序列相似度最大,对目前电网环境环境下的智能电表监测数据进行负荷分解;可适用于时间采样间隔为1分钟的监测量功率数据的负荷分解,采样环境适应性强,硬件成本低,且能达到较高的负荷分解准确率。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的目的是提供一种基于模糊聚类和支持向量回归的非侵入式负荷监测方法,对目前电网环境环境下的智能电表监测数据进行负荷分解,模型操作简单,在提高负荷分解准确率的同时,降低了计算成本。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
如图1所示,本发明提供的基于模糊聚类和支持向量回归的非侵入式负荷监测方法,包括以下步骤:
步骤1,测量设定时间段内所有负荷的运行功率,提取负荷特征集;
步骤2,对监测总功率序列中的功率值进行模糊聚类,选定中心点值最大的聚类,构建待分解的总功率序列;
步骤3,基于负荷特征集,提取各负荷的特征序列,比较待分解的总功率序列与各负荷的特征序列之间的距离,识别出最大贡献负荷;
步骤4,采用支持向量回归对最大贡献负荷的功率值进行估计;
步骤5,将最大贡献负荷的功率值从原监测总功率序列中减去,并进行误差校验;
步骤6,重复步骤2到步骤5,直到所有负荷分解完成。
其中,所述步骤1,测量设定时间段内所有负荷的运行功率,提取负荷特征集,具体包括:
在设定时间段T内,获取各负荷运行的功率值组成训练数据库DT;
从训练数据库中提取每种负荷的运行曲线通过减去阈值的方式进行去噪处理后构成负荷特征集S={Si},由于所选设备的最小功率大于30瓦,因此预设阈值设置为30瓦。
本实施例以公共数据集AMPds2为研究对象,选取典型的户内用电负荷熨烫机、空调、网络设备、冰箱的部分功率监测值,见图2所示,数据采样间隔为1分钟。考虑到用户习惯对特征集的影响,设定时间T至少包含一周,为了减少侵入性,确定T=7天。
所述步骤2,对监测总功率序列中的功率值进行模糊聚类,选定中心点值最大的聚类,构建待分解的总功率序列,具体包括:
对监测总功率序列P中的功率值进行模糊聚类;
中心值最大的聚类中的功率值被提取后,其它值均设置为0得到待分解的总功率序列Aj。
几次聚类的结果见图3,其中横坐标表示聚类得到的簇编号,功率点用小星号表示,每个簇的中心值用略大的星号表示。每次聚类的结果中,中心值最大的聚类即为当前最大贡献的负荷运行的功率值类,将其中的功率值提取后,其它值均设置为0得到总功率序列Aj。
总功率序列Aj与特征集中的特征序列Si最相似的负荷被认为是对当前总功率序列贡献最大的负荷。由于Aj和Si序列的长短不同,为了衡量两者之间的相似性,通过计算Aj和Si动态时间规整距离来判断识别当前最大贡献的用电负荷。
所述步骤3,基于负荷特征集,提取各负荷的特征序列,比较待分解的总功率序列与各负荷的特征序列之间的距离,识别出最大贡献负荷,具体包括:
基于负荷特征集,提取各负荷的特征序列Si;
计算待分解的总功率序列Aj与各负荷的特征序列Si之间的距离,如下:
D(Aj,Si)=DTW(Aj,Si);
选取距离最短的特征序列对应的负荷作为当前最大贡献负荷。
其中,Aj表示为Aj=[x(1),x(2),...,x(t)]T,Si表示为Si=[y(1),y(2),...,y(T)]T,Aj和Si之间的动态时间规整距离的计算方法如下:
首先,计算Aj和Si各元素之间的成对距离存储在本地成本矩阵Ct×T中,有:
Ct×T={C(m,n)}m=1,2,...,t;n=1,2,...,T
C(m,n)=d(x(m),y(n))m=1,2,...,t;n=1,2,...,T
其中,C(m,n)为Ct×T中m行n列的元素,即为x(m)和y(n)之间的欧式距离,即:
d(x(m),y(n))=|x(m)-y(n)|
其次,设Aj和Si之间从(1,1)到(m,n)的规整路径为p=(p1,p2,...,pk,...pl),其中pk=(mk,nk)∈{1,2,...,m}×{1,2,...,n},边界条件约束为:
p1=(1,1),pl=(m,n)
m1≤m2≤...≤ml,n1≤n2≤...≤nl
pk+1-pk∈{(1,1),(0,1),(1,0)}
l为路径长度,则规整路径p的累积距离为:
其中,k∈{1,2,...,l},l∈[max(m,n),m+n-1]。
最后,采用下式所示的动态规划算法搜索Aj和Si之间的最佳路径,得到最短累积距离D(t,T),得到:
DTW(Aj,Si)=D(t,T)
即为总功率序列段Aj和Si的距离。
所述步骤4,采用支持向量回归对最大贡献负荷的功率值进行估计,具体包括:
步骤4.1,将负荷特征集按照运行周期进行分割,用作功率值估计的训练数据;
步骤4.2,使用遗传算法对支持向量回归算法的c和g参数进行优化,得到优化的支持向量回归模型,优化流程如图4所示,具体步骤如下:
首先,对c和g参数进行基因编码,基因编码结构见图5,初始化种群构建支持向量回归模型,并采用遗传算法对功率序列进行估计;
其次,通过计算估计的功率序列P与测量的真实功率序列之间的欧式距离d获得序列的估计误差Ec,即:
将序列的估计误差Ec作为适应度值,Ec越小,则参数的值越优;
最后,按照图4的流程,经过选择、交叉、变异等过程,迭代计算得到最优的c和g,进行c、g参数优化后,即可使用现成的模型进行训练和估计;
步骤4.3,使用功率做为唯一特征,采用步骤4.3得到的优化支持向量回归模型进行训练,并进行最大贡献负荷的功率值估计,得到与P等长的序列Aj'。
所述步骤5,将最大贡献负荷的功率值从原监测总功率序列中减去,并进行误差校验,具体包括:
步骤5.1,按照下式计算不包括当前最大贡献负荷运行的新的总功率序列:
P=P-Aj'
步骤5.2,对当前新的总功率序列进行误差校验,考虑以下三种情况:
第一,检查当前新的总功率序列,若功率值出现负值,认为有估计误差,将该值设置为前后两个功率值的平均值,并反过去调整支持向量回归算法估计的功率值;
第二,如果聚类后获得的子序列短于特征中对应负荷的子序列,认为有估计误差,将错误的聚类功率值调整为该聚类邻居的中心值,并补偿先前的功率估计;
第三,标识为同一负荷的多个同时运行状态的值被认为是估计误差,重新将最大贡献负荷识别为距离与Aj次近的负荷。
所述步骤6中,重复步骤2到步骤5,直到所有负荷分解完成,具体为:
迭代进行步骤2到步骤5的过程,直至只剩恒运行负荷为止,所述恒运行负荷指的是在运行期间功率无明显变化的负荷。由于恒运行的负荷在运行期间功率变化不大,聚类算法只能将功率值分为2类及以上,所以当只剩恒运行负荷在运行时,该方法不再试用,只需直接估计恒运行负荷的功率值即可。本发明从AMPds数据集中选取了1周的数据用于特征集提取,1周的数据作为测试数据,4种用电负荷冰箱、空调、网络设备、熨烫机的估计值和测量值对比见图6(a)至图6(d)。
本发明提供的基于模糊聚类和支持向量回归的非侵入式负荷监测方法,采用模糊聚类识别对功率贡献最大的负荷,支持向量回归方法可对功率贡献最大的负荷运行期间的功率值进行估计,提出基础是贡献最大的负荷的功率序列与监测总功率序列相似度最大,对目前电网环境环境下的智能电表监测数据进行负荷分解;可适用于时间采样间隔为1分钟的监测量功率数据的负荷分解,采样环境适应性强,硬件成本低,且能达到较高的负荷分解准确率。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。