一种基于SVM概率输出模型的大型变压器故障识别算法|svm|原理|变压器

电力系统中,油浸变压器保证了变压器的正常工作运转。监测手段目前主要是集中在物理与化学方法两个层面,目前对变压器故障诊断常用的一种方法是油中溶解气体分析(dissolved gas analysis,DGA),这种方法发现故障的原理是对气体的含量与组成进行监测,监测过程中不会干扰到变压器的正常运行。构造分类器的结构风险优化是通过支持向量机理论(support vector machine,SVM)实现,此种方法可较好解决非线性与小样本的问题,且目前已有大量研究成果。本文针对故障诊断方法的局限建立起一种基于支持向量机多分类概率输出方法(SVM Based Category Probability Output Method,SVMCPO)[1],主要是通过概率实现,引入SVM对结果发生的概率进行总结。结果的分析总结可明确诊断故障特征,进而对故障类型进行确定;排除确认的故障后,对于模糊的故障问题可应用多数相近故障判断出是否为真实故障。这一方法对以往的SVM方法进行改进弥补,继承原有优点,明确了故障诊断,针对不明确的变压器故障来说具有极大的实用效果。

1 基于SVM概率输出的多分类模型

1.1 支持概率输出的SVM

SVM分类决策函数表达式:,式中K(xi,x)为核函数,αi为拉格朗日乘子,xi为样本数据,yi为样本标签值。SVM函数会针对不同任一样本(xi,yi)都会输出获得明确的数值。随着研究的不断深入,在目前阶段提出了拥有概率输出的分类SVM。笔者在进行研究中参考的方法主要是建立在学者John C.Plat研究之上的,这一方法借用了Sigmoid函数,并对这个函数赋予参数,区间[0,1]为决策函数的映射区间,概率输出表达式为[2]:

1.2 基于SVM概率输出的多分类模型

变压器运行中发生的故障问题并非是单一性的,存在多分类性。一个k分类问题得出的数据结果要依靠k(k-1)/2个二分类,每一类的概率获得依靠rij,概率输出的结果才是多分类的,进而获得pi,即每一类的概率[3],即:。学者Ting-Fan Wu、Chih-Jen Lin和Ruby C.Weng等提出多分类概率方法,基于该方法可以推导得出rij+rji=1、rij≈pi/(pi+pj),进而得到:,将其简单变换之后获得公式:,依据rij和pi的关系、配合此公式,pi的数值可根据模型(1)、(2)求得具体数值。

冗余的约束是pi≥0,记pT=[p1,p2,…,pk],将问题演变成凸二次规划,最优解在满足公式(1)和(2)的前提下求得:

求解最优解的流程为:重复迭代令t=1,…,k,1,…,k,1…更新pt,归一化处理p,对p进行是否满足条件的验证,停止迭代的标志其实满足要求,获得结果,即多分类的概率p[4]:

2 输出故障概率的变压器故障诊断方法

在SVM对数据处理的过程中经常会出现异常数值以及噪音,与正常状态下的样本空间之间存在一些偏差,对于数据偏离情况,在SVM算法中应用加入松弛变量为偏移提供空间,通过大量的实验数据表明,在超平面附近会分布大量的偏移样样本。出现在此平面附近的还有待分类样本,分类错误往往发生在此种环境背景下,影响分类结果的因素还有核函数和惩罚参数C数值的选择[5]。

根据气体含量不同、表现故障情况不同这一基本原理概念,进而研发出根据溶解气体含量分析变压器故障的方法,现实当中由于气体含量在故障中的表现存在很大的相似性。建立在SVM分析故障的基础上,提取实际的气体含量信息,通过对气体数据的分析得到多分类结果,针对诊断故障的样本通过SVM分析可获得故障类型的确定信息。在上文的论述中,已知悉的是分类边界附近也分布特征样本,但是其特征表现并不明显,应用SVM实践方法也未必获得正确的样本分类信息,进而导致此种方法也容易出现错误的故障诊断。

2.1 故障特征量的选取和故障分类

在变压器的运转过程中会发生老化现象,老化现象是化学反应,这个过程中生成的水分、CO、CO2、H2、烃类以及呋喃等物质可利用化学分析法监测得出。伴随不断改进的化学分析技术,目前对这一过程中生成的气体做到了随时在线监测,轻松判断油中溶解了何种成分,目前针对变压器监测与故障诊断的方法主要是DGA,故障情况不同,以及气体含量不同,在实践中表现的情况不同,根据这种差异可以判断出故障类型[6]。

本文选取的特征参数气体是H2、CH4、C2H6、C2H4、C2H2,将气体参数特征向量输入到样本(x,y)中,得到构成向量(x1,x2,x3,x4,x5),故障类型用字母y表示。根据IEC60599,将故障划分为六种:温度低于300℃低温过热T1、温度介于300～700℃的中温过热T2、温度高于700℃的高温过热T3、局部放电PD、低能放电D1、高能放电D2,诊断模型针对故障做出每种故障的概率。

2.2 诊断模型参数的选择

变压器故障的诊断正确性很大程度上会受到核函数和惩罚参数C的影响,依靠径向基函数确定了模型的核函数K(xi,xj)=exp(-γ‖xi-xj‖2),应进一步确定核函数中的参数γ与SVM的惩罚参数C。文章在论述中主要依靠的方法是网格搜索,交叉验证训练样本,参数(C,γ)选择确定的基础是以最准确为最终参数。其中C的取值范围为[10-6,10-5,…,105,106],γ的取值范围为[10-5,10-4,…,104,105],共计143个参数组合。

2.3 故障诊断流程

首先进行对故障诊断过程中需要的大量气体溶解数据进行搜集,建立起测试与训练样本集;获得最佳参数(C,γ),此过程中应用到的方法是交叉验证;在第二步流程中获得最佳参数,通过已得的最佳参数进行训练,训练的对象是SVM和Sigmoid,进而得到A、B参数,为故障诊断模型的建立打下了数据基础;将获得样本投入到故障诊断模型当中,获得故障诊断结果。

3 算例分析

针对故障诊断,本来在研究中搜集的数据用量为312。在整体样本中,训练样本与测试样本集的数量分别为213与99。为进一步论述本文方法(SVMCPO)的优点,采用了同样样本同时应用分层决策SVM诊断的模式方法,并对两项结果进行对。

在故障模型中,输出的故障分类概率具有一定的意义,在各种故障当中,应用方法SVMCPO诊断所得的最大故障类的样本数据使用字母S1表示,发生在实际故障中的,即概率次样本的最大故障类应用字母S2,第三大故障类使用字母S3表示。T2表示的实际故障是序号2的故障数据,在方法SVMCPO中57.75%为T2中的最大概率,用S1表示其类别。在诊断样本容量的99个数据中,用黑体标注了位于S2、S3中的数据。

每一个样本呢诊断数据结果都用不同的字母表示,故障T1、T2、T3、PD、D1、D2概率记为P1、P2、P3、P4、P5、P6,最大概率为max P=max{p1,p2,p3,p4,p5,p6},将最大概率数值取出,计算出最大概率的标准差σ。表1表达的内容是在S1、S2、S3区域内的样本数据结果。通过对表1的观察,maxP和σ均值在S3中表现的数值,最大是S1,S2介于两者之间。

由于在实际中对于三个样本的类型是无法诊断获得的,分析上表,maxP越大其故障特征越明显,标准差σ越大;反之则不明显。所以可根据maxP和σ区分判断样本的特征明显与否。本文选取的样本中故障特征明显的数据占据了大部分。对于相同样本,使用分层决策SVM诊断,结果表明,99个样本中诊断正确与错误的占比分别是90与9,正确率高达90.9%,与传统方法对比保证了编码的完整性,准确性也大大提高。

本文对变压器故障诊断依据的原理是,变压器在工作过程中发生老化进而产生气体,气体会与油有一定的相溶,但是故障不同、气体的溶解程度与溶解量有所差异,进而对故障类型进行判别。与传统方法对比,SVM方法存在的优点是拥有较强的泛化能力,不需要过多的样本,同时得到的结果概率信息较为详细,对样本的分类结果更加精准。