2 关联分析原理及其流程
2.1关联分析原理
本文的关联分析采用皮尔逊相关分析法,也称为积差相关,是英国统计学家皮尔逊与20世纪提出的一种计算直线相关性的方法。其基本原理是假设存在两个变量X,Y,那么两变量的皮尔逊相关系数可以通过式(1)进行计算。
皮尔逊相关系数的范围为[-1,1],绝对值越接近1,相关性越强;绝对值越接近于0,相关性越弱,相关系数小于0时表示两个变量呈负相关,相关系数大于0时表示两个变量呈正相关。一般皮尔逊系数大于0.2时,可认为两个变量之间存在相关性。
2.2关联分析流程
对电网设备故障统计数据与电能质量监测数据进行关联分析时,首先需要分别对电能质量监测数据和电网设备故障统计数据进行预处理。
对电网设备故障统计数据的预处理包括两个步骤:
挑选出已安装电能质量监测终端的变电站内的设备故障统计数据,并将各变电站内的各类设备故障发生次数进行汇总;
将汇总得到的数据进行归一化处理,变换至[0,1]之间;
由于电网设备故障是瞬时性的,而稳态电能质量监测数据是长期性的。本文针对电网设备发生次数统计与电能质量监测数据进行关联分析,因此只能计及电能质量监测数据的空间特性,忽略时间特性。筛选出对应设备发生故障变电站,并获取其电能质量监测终端的监测数据,对监测数据按以下步骤进行预处理:
整个监测周期内电能质量监测终端监测得到的各电能质量指标最大值作为该变电站的电能质量指标最大值。
将电能质量监测终端按月统计的各电能质量指标平均值在整个监测周期内进行平均,获得该变电站各电能质量指标的平均值。
整个监测周期内容电能质量监测终端按月统计的各电能质量指标95概率大值在整个监测周期内做95概率大值进行计算,作为该变电站各电能质量指标的95概率大值。
对以上三个步骤中计算出的各变电站中各电能质量指标值进行归一化处理,将所有数据变换至[0,1]之间。
通过数据的预处理,电网设备故障次数的统计数据和电能质量监测的各项电能质量指标均映射为[0,1]区间的数值
通过皮尔逊相关分析法计算变量间的皮尔逊相关系数,可获得皮尔逊系数构成的mxn维的关联矩阵,如式(4)所示。
关联矩阵关联矩阵中皮尔逊相关系数大于0.3的两个变量可以认为具有相关性。
总结相关性分析流
电能质量监测数据的预处理按如下步骤进行:
设备故障数据的预处理按如下步骤进行:
将预处理后电能质量监测数据和设备故障数据进行正态分布检验或单峰分布检验,若检验未通过则进行适当的变换使变换后的数据近似服从正态分布或单峰分布,缩小皮尔逊相关系数的计算误差。
将通过正态分布或单峰分布检验的电能质量监测数据和设备故障数据按变电站进行配对,准备计算各组数据的皮尔逊相关系数。
在完成数据的预处理后,对各设备和各电能质量指标进行大范围、多角度的皮尔逊关联分析,由于分析过程较长,故较详细的分析过程不能在文章中给出。分析结果表明,电容器组故障与电能质量的相关性最强,因此,本文分析的重点放在电容器组故障与各电能质量指标相关性的分析。
3 关联分析结果分析
3.1谐波电压畸变率与电容/电抗器组故障统计数据
计算谐波电压各监测项目与电容器组故障数据的皮尔逊相关系数,各相谐波电压监测项目与电容器组故障数据的皮尔逊相关系数的计算结果如表3所示。
各次谐波电压含有率的95概率大值与电容器组故障数据的皮尔逊相关系数的计算结果如表4所示。