设计应用

基于AdaBoost算法的剩余电流分类方法

0 引言

    低压电网中广泛使用剩余电流保护装置,用于预防火灾,防止人身触电伤亡事故。剩余电流保护装置的动作原理主要在于动作整定值的设定,与是否是人体触电电流,或是设备的启动电流无直接关系。因此保护装置会发生拒动、误动,也间接造成了设备的投运率低等问题。如何智能判定当前剩余电流的种类是智能剩余电流保护装置的亟待解决的一个问题。

    当前国内外的剩余电流检测方法主要包括神经网络检测法、最小二乘支持向量机检测法和基于自适应算法的检测法。文献[1]-[5]将小波包变换、能量熵、量子遗传等技术与人工神经网络相结合,建立了相关分类模型,为有效识别类型提供了理论支撑。文献[6]采用最小二乘支持向量机可较为准确地从总漏电电流中识别出生物体触电电流。文献[7]基于自适应滤波原理,建立了自适应触电电流检测模型,噪声鲁棒性好,能有效消除保护动作死区。但文献[1]-[4]的方法主要用于电力系统的故障识别,文献[5]-[7]的方法主要用于触电电流的识别。剩余电流保护有别于电力系统故障,同时会受到多样负荷变化引起的漏电流变化的影响。

    上述相关工作表明,针对剩余电流进行分类具有一定的可行性。本文将在现有工作的基础上,对相关的剩余电流特征等进行构建及提取,进而达到对剩余电流类型的预测。

1 剩余电流试验与数据获取

    搭建生物体触电物理实验平台如图1所示。实验平台主要由实验电源、负载、用户对地泄漏阻抗、线路对地分布阻抗、触电支路、故障录波器和电压电流互感器组成。实验平台的连接关系是采用实验电源串联负载供电,在实验电源的电流出口处安装电压电流互感器,故障录波器连接电压电流互感器并读取其中的触电电压电流数据,触电支路、线路对地分布阻抗、用户对地泄漏阻抗的一端接在电压电流互感器后面与负载中间,另一端接地。其中,采用三相电源作为实验电源,通过调压器向负载直接供电;负载采用实验箱灯泡负载;以大电阻和电容的并联来作为线路对地的绝缘阻抗;触电支路是采用大电阻和生物体的串联来实现的。

dy6-t1.gif

    通过该触电实验平台,可获得植物触电、动物触电、间接触电等触电类型的剩余电流数据。典型的一类触电数据可视化如图2所示。

dy6-t2.gif

    从该触电数据,可以看出典型的触电数据一个时域的具有一定周期性特征的波形,为了对该数据进行分类及处理,亟待对该数据进行特征提取。为此,本文通过构造7种不同的触电数据特征以进行触电数据的分类实验。

2 特征参数提取

    如上一节分析,当前的电流可根据信号的统计量计算原理[8-11]对剩余电流信号均值、标准差、方根幅值、均方根值、峰值、偏度、峰度7个典型时域特征量进行计算,这几个特征将用于代表原始数据从而进行相关分类的操作。

    (1)均值

    为了表示信号波动能量的整体水平,信号x(t)的离散表达式xi(i=1,2,…,N)均值可以表示为:

    dy6-gs1.gif

    均值属于有量纲特征参数。均值表示的是信号幅值的算术平均值,那么对应地,绝对平均值则表示信号幅值绝对值的算术平均值,绝对平均值可以表示为:

    dy6-gs2.gif

    (2)标准差

    为了描述信号偏离中心趋势μx的波动强度,方差用来表示信号的波动分量,标准差则为方差的正平方根值,属于有量纲特征参数。对于有限平稳信号x(i),其计算无偏标准差为:  

    dy6-gs3.gif

    (3)方根幅值

    描述信号的波动强度大小,属于有量纲特征参数。其表达式为:

    dy6-gs4.gif

    (4)均方根值

    信号的均方根用来反映信号的振动强度大小,也可以反映信号的能量大小。均方根值是相对于时间的平均,属于有量纲特征参数,它的表达式如式(5)所示:

    dy6-gs5.gif

同时,信号的均方根值可以通过方差和均值求得:

    dy6-gs6.gif

    (5)峰值

    峰值是指信号的最大瞬时值,用来反映信号的强度大小,属于有量纲特征参数,表达式为:

    dy6-gs7.gif

    (6)偏度

    偏度用来衡量信号相对于其均值的对称性,定义为:

    dy6-gs8.gif

    偏度的值可以为正,可以为负,甚至是无法定义。当分布偏左时,偏度为负值;当分布偏右时,偏度为正值;当分布关于均值对称时,偏度为零。

    (7)峰度

    峰度可感知信号中的微小冲击成分,可以描述分布形态的陡缓程度,其定义为:

    dy6-gs9.gif

    正态分布的峰度为3,若峰度大于3表明有过度的峰度,峰度小于3则表明峰度不足。

3 基于AdaBoost算法的剩余电流类型识别

3.1 AdaBoost基本原理

    AdaBoost是“Adaptive Boosting”(自适应增强)的缩写,是一种迭代算法[17],在每一轮中加入一个新的弱分类器,直到达到某个预定的足够小的错误率或迭代次数。每个训练样本都被赋予一个权重,表明它被某个分类器选入训练集的概率。如果某个样本点已经被准确地分类,那么在构造下一个训练集中,它被选中的概率就被降低;相反,如果某个样本点没有被准确地分类,那么它的权重就得到提高。通过这样的方式,AdaBoost方法能“聚焦于”那些较难分(更富信息)的样本上。AdaBoost的自适应性就体现在前一个弱分类器被错误分类的样本的权值在下次迭代时增大,而正确分类的样本的权值会减小,并再次用来训练下一个弱分类器。通过分析,本文的剩余电流分类问题可映射到AdaBoost的模型。本文通过建立多个特征用于刻画剩余电流的特点,而后利用AdaBoost模型对剩余电流进行求解。

3.2 面向剩余电流分类的AdaBoost 算法

    给定训练数据集:(x1,y1),(x2,y2),…,(xN,yN),其中xi∈X,yi∈Y用于表示训练样本的标签,i=1,2,…,N。其中xi代表本文第二部分的相关特征,yi代表相关分类的情况。最大迭代次数为T。具体的算法实施步骤如下所示。

    (1)初始化训练数据的权值分布。每个训练样本最开始是都被赋予相同的权值wi=1/N,训练样本集的初始权值分布D1(i)为:

    dy6-gs10.gif

    (2)从t=1,2,…,T迭代:

    ①选取一个当前误差率最小的弱分类器h作为第t个基本分类器Ht,并计算弱分类器ht:X→{-1,+1},该弱分类器在分布Dt上的误差为:

     dy6-gs11-13.gif

dy6-gs14-17.gif

    在获得相关的H之后,即可对相关的数据进行训练及模型验证。

3.3 实验分析

    实验数据有三类:动物触电数据85组、植物触电数据75组、动物间接触电数据120组。每组数据有3 000个采样点,每100 μs采样一次。得出样本的7个特征参数后进行测试。

    当训练集为数据集的75%,参数algorithm为SAMME时,测试集的准确率最高,为0.914,算法的准确率、召回率等结果如表1所示。

dy6-b1.gif

    由上表可知当三种触电数据混合时,算法对动物触电数据的分类结果最好,对植物触电数据的分类结果最差。

3.4 方法对比

    常用的分类算法有SVM、决策树、随机森林、贝叶斯分类器、神经网络等,作为对比实验,本次使用SVM、决策树、随机森林进行测试。使用这三种算法在相同数据集上测试得到对应的准确率、召回率等结果如表2所示。

dy6-b2.gif

    由表2可知,与AdaBoost算法相似,SVM、决策树、随机森林三种算法对动物触电数据的分类准确率都很高,对植物触电数据的分类准确率相对较低。在当前数据集效果下,AdaBoost的准确率最高。

    四种算法分类准确率比较如图3所示。由图3可知,四种算法对动物触电数据分类的准确率都比较高而且准确率差别很小;在植物触电数据分类的准确率相对较低而且差别较大。其中AdaBoost对三种数据分类的准确率都在80%以上;SVM对植物触电的分类准确率最低为50%,和随机猜测的准确率相近。四种算法中,AdaBoost对三种数据的分类准确率都比较高,然后是随机森林、决策树。

dy6-t3.gif

4 结论

    本文通过选取剩余电流中的多个特征作为训练特征,构建了基于AdaBoost的剩余电流分类方法,并对比了随机森林、SVM等主流的分类算法。实验表明,AdaBoost 对三种数据的分类效果较好,可以调整后用于实际触电数据的分类,对未来的实际应用有一定的借鉴价值。未来将对AdaBoost的参数调整等进行研究,力争达到更好的效果。

参考文献

[1] 林圣,何正友,臧天磊,等.基于粗神经网络的输电线路故障分类方法[J].中国电机工程学报,2010,30(28):72-80.

[2] 李孝全,庄德慧,张强.基于粗糙径向基神经网络的电网故障诊断新模型[J].电力系统保护与控制,2009,37(18):20-24.

[3] 张举,王兴国,李志雷.小波包能量嫡神经网络在电力系统故障诊断中的应用[J].电网技术,2006,30(5):72-76.

[4] 李东敏,刘志刚,苏玉香.基于多小波包和人工神经网络的电力系统故障类型识别[J].电力自动化设备,2009,29(1):99-104.

[5] 王金丽,刘永梅,杜松怀,等.基于剩余电流固有模态能量特征的生物体触电故障诊断模型[J].农业工程学报,2016,32(29):202-208.

[6] 韩晓慧,杜松怀,苏娟,等.基于参数优化的最小二乘支持向量机触电电流检测方法[J].农业工程学报,2014,30(23):238-245.

[7] 熊晓祎,肖先勇,赵恒.基于自适应算法的触电事故电流检测[J].电力系统保护与控制,2017,45(4):139-144.

[8] 王涛,山拜·达拉拜,柳贵东.基于高阶统计量的信号特征描述[J].通信技术,2011,44(2):151-154.

[9] 何海平,计时鸣,张利.基于高阶统计量的信号分析与处理[J].机电工程,2003,20(5):85-87.

[10] 俞卞章.数字信号处理(第2版)[M].西安:西北工业大学出版社,2002.

[11] 张琼,杨俊安,夏建明.基于偏度的低空目标声信号盲抽取算法[J].数据采集与处理,2011,26(1):69-74.

[12] 杜松怀.电力系统接地技术[M].北京:中国电力出版社,2011.

[13] MITOLO M.Shock hazard in the presence of protective residual-current device[J].IEEE Transactions on Industry Applications,2010,46(4):1552-1557.

[14] Cheng Peng,Yan Han,Fan Zhenqi.Design of a residual current circuit breaker IC with anti-interference technique[J].Analog Integr Circ Sig Process,2010,64:199-204.

[15] 李奎,陆俭国,岳大为,等.漏电信号的识别技术及其方法[J].低压电器,2008(23):1-4.

[16] 蔡志远,庞佳,陈廷辉.基于剩余电流和漏电阻抗的漏电保护方法的研究[J].电力系统保护与控制,2011,39(12):61-64.

[17] FREUND Y,SCHAPIRE R E.A decision-theoretic generalization of on-line learning and an application to boosting[J].CiteSeerX,1995.



作者信息:

刘永梅1,杜松怀1,盛万兴2

(1.中国农业大学 信息与电气工程学院,北京100083;2.中国电力科学研究院有限公司,北京100192)

剩余电流分量 分类方法 触电电流 Adaboost算法