留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

一种可解释人工智能(XAI)在测量设备故障诊断和寿命预测中的应用

上一篇

下一篇

陈长基, 梁树华, 吴达雷, 等. 一种可解释人工智能(XAI)在测量设备故障诊断和寿命预测中的应用[J]. 西南大学学报(自然科学版), 2024, 46(1): 167-177. doi: 10.13718/j.cnki.xdzk.2024.01.014
引用本文: 陈长基, 梁树华, 吴达雷, 等. 一种可解释人工智能(XAI)在测量设备故障诊断和寿命预测中的应用[J]. 西南大学学报(自然科学版), 2024, 46(1): 167-177. doi: 10.13718/j.cnki.xdzk.2024.01.014
CHEN Changji, LIANG Shuhua, WU Dalei, et al. An Application of Explainable Artificial Intelligence (XAI) for Fault Diagnosis and Life Prediction of Measurement Equipment[J]. Journal of Southwest University Natural Science Edition, 2024, 46(1): 167-177. doi: 10.13718/j.cnki.xdzk.2024.01.014
Citation: CHEN Changji, LIANG Shuhua, WU Dalei, et al. An Application of Explainable Artificial Intelligence (XAI) for Fault Diagnosis and Life Prediction of Measurement Equipment[J]. Journal of Southwest University Natural Science Edition, 2024, 46(1): 167-177. doi: 10.13718/j.cnki.xdzk.2024.01.014

一种可解释人工智能(XAI)在测量设备故障诊断和寿命预测中的应用

  • 基金项目: 国家重点科技项目(2020YFB0906003);中国南方电网有限责任公司科技项目(070000KK52200021)
详细信息
    作者简介:

    陈长基,工程师,主要从事电能计量研究 .

    通讯作者: 吴达雷,高级工程师; 
  • 中图分类号: TP391

An Application of Explainable Artificial Intelligence (XAI) for Fault Diagnosis and Life Prediction of Measurement Equipment

  • 摘要:

    基于人工智能算法的变压器故障诊断和寿命预测模型在提高准确率方面已经达到了很好的效果,但是仍存在泛化性能较低,对数据质量要求过高,判断结果无法解释等问题. 该文基于DBSO-CatBoost模型,提出一种可用于故障判断解释的变压器故障诊断方法. 该方法基于数据特征提取,采用差分变异头脑风暴优化(DBSD)算法对CatBoost模型进行优化和故障诊断. ①对于数据预处理,引入比率法在原始数据中添加特征;采用基于可解释人工智能(XAI)的Shapley加法解释(SHAP)技术进行特征提取,并采用核主成分分析算法对数据进行降维. Shapley加法解释技术可根据特征贡献解码每个预测来帮助全局解释并评估预测结果. ②将预处理后的数据输入到CatBoost模型中进行训练,并采用差分变异头脑风暴优化算法对CatBoost模型的参数进行优化,从而得到最优模型. ③利用得到的优化模型诊断变压器故障并输出故障类型与预测结果. 实验使用来自中国国家电网公司西北部某电网的真实数据评估该模型. 结果表明:该文模型在不同故障诊断中的准确性最佳,平均准确率高达99.29%,证明该文方法可以有效提高电力变压器故障诊断的准确性和效率.

  • 加载中
  • 图 1  基于DBSO-CatBoost的变压器故障诊断预测模型

    图 2  集成学习原理增强框图

    图 3  各特征的SHAP值蜂群图

    图 4  不同样本特征的SHAP平均绝对值

    图 5  不同方法的分类准确性对比

    图 6  不同模型的均方误差(MSE)对比

    图 7  不同迭代次数的自适应曲线

    表 1  不同迭代次数下模型的故障诊断准确性

    故障类型 迭代次数/%
    2 4 6 8
    LT(<150 ℃) 100 100 99.26 100
    LT(150 ℃~300 ℃) 100 100 47.26 100
    局部放电(PD) 0 100 100 72.53
    电弧放电(AD) 58.92 97.17 45.36 96.77
    下载: 导出CSV
  • [1] 翁海燕. 电力变压器智能化监测与控制技术研究[J]. 工程学研究与实用, 2022, 3(16): 58-60.
    [2] WANG Y, ZHANG X Y, LIU H F, et al. Intelligent Identification of the Line-Transformer Relationship in Distribution Networks Based on GAN Processing Unbalanced Data[J]. Sustainability, 2022, 14(14): 8611-8625. doi: 10.3390/su14148611
    [3] ODONGO G, MUSABE R, HANYURWIMFURA D. A Multinomial DGA Classifier for Incipient Fault Detection in Oil-Impregnated Power Transformers[J]. Algorithms, 2021, 14(4): 128-149. doi: 10.3390/a14040128
    [4] 吴祥校, 单振飞. 电力应急管理体系建设的要点分析[J]. 水电科技, 2022, 5(6): 134-136.
    [5] 杨清雄, 刘娟. 电网调度运行常见故障及预防处理措施[J]. 电力工程技术创新, 2022, 4(2): 43-45.
    [6] 郑阳. 电力设备状态检修技术分析[J]. 工程学研究与实用, 2022, 3(3): 64-66.
    [7] 朝乐门. 人工智能治理框架及其人文社会科学研究问题分析[J]. 情报资料工作, 2022, 43(5): 6-15.
    [8] KIKUTSUJI T, MORI Y, OKAZAKI K I, et al. Explaining Reaction Coordinates of Alanine Dipeptide Isomerization Obtained from Deep Neural Networks Using Explainable Artificial Intelligence (XAI)[J]. The Journal of Chemical Physics, 2022, 156(15): 154108. doi: 10.1063/5.0087310
    [9] FANG H R, SHAO Y, XIE C, et al. A New Approach to Spatial Landslide Susceptibility Prediction in Karst Mining Areas Based on Explainable Artificial Intelligence[J]. Sustainability, 2023, 15(4): 3094-3115. doi: 10.3390/su15043094
    [10] ASLAM N, KHAN I U, MIRZA S, et al. Interpretable Machine Learning Models for Malicious Domains Detection Using Explainable Artificial Intelligence (XAI)[J]. Sustainability, 2022, 14(12): 7375-7396. doi: 10.3390/su14127375
    [11] KAWAKURA S, HIRAFUJI M, NINOMIYA S, et al. Analyses of Diverse Agricultural Worker Data with Explainable Artificial Intelligence: XAI Based on SHAP, LIME, and LightGBM[J]. European Journal of Agriculture and Food Sciences, 2022, 4(6): 11-19. doi: 10.24018/ejfood.2022.4.6.348
    [12] PRADHAN B, JENA R, TALUKDAR D, et al. A New Method to Evaluate Gold Mineralisation-Potential Mapping Using Deep Learning and an Explainable Artificial Intelligence (XAI) Model[J]. Remote Sensing, 2022, 14(18): 4486-4506. doi: 10.3390/rs14184486
    [13] 谭翼坤, 陈明, 黄腾, 等. 基于气体成分分析的变压器过热隐患预警方法[J]. 电气技术, 2022, 23(10): 51-58.
    [14] 高晨, 赵勇, 汪德良, 等. 海上风电机组电气设备状态检修技术研究现状与展望[J]. 电工技术学报, 2022, 37(S1): 30-42.
    [15] SHUTENKO O, KULYK O. Recognition of Combined Defects with High-Temperature Overheating Based on the Dissolved Gas Analysis[J]. Sādhanā, 2022, 47(3): 1-14.
    [16] FERNÁNDEZ-BLANCO J C, CORRALES-BARRIOS L B, BENÍTEZ-PINA I F, et al. A Proposal for the Diagnosis of Incipient Faults in Power Transformers Using Fuzzy Logic Techniques[J]. International Review of Electrical Engineering (IREE), 2022, 17(1): 29-38. doi: 10.15866/iree.v17i1.20772
    [17] KUKKER A, SHARMA R, MALIK H. An Intelligent Genetic Fuzzy Classifier for Transformer Faults[J]. IETE Journal of Research, 2022, 68(4): 2922-2933. doi: 10.1080/03772063.2020.1732844
    [18] EL-KENAWY E S M, ALBALAWI F, WARD S A, et al. Feature Selection and Classification of Transformer Faults Based on Novel Meta-Heuristic Algorithm[J]. Mathematics, 2022, 10(17): 3144-3171. doi: 10.3390/math10173144
    [19] CHEN Y S. Research on IGOA-LSSVM Based Fault Diagnosis of Power Transformers[J]. Journal of Vibroengineering, 2022, 24(7): 1262-1274. doi: 10.21595/jve.2022.22439
    [20] 何清波, 彭志科. 先进感知与智能损伤评估的机遇与挑战[J]. 仪器仪表学报, 2022, 43(3): 1-2.
    [21] 宫文峰, 陈辉, WANG Danwei, 等. 基于改进CNN-GAP-SVM的船舶电力变换器快速故障诊断方法[J]. 计算机集成制造系统, 2022, 28(5): 1370-1384.
    [22] CHENG J, FENG Z, XIONG Y. Transformer Fault Diagnosis Based on an Improved Sine Cosine Algorithm and BP Neural Network[J]. Recent Advances in Electrical & Electronic Engineering (Formerly Recent Patents on Electrical & Electronic Engineering), 2022, 15(6): 502-510.
    [23] 赵书涛, 许文杰, 刘会兰, 等. 基于振动信号谱形状熵特征的高压断路器操动状态辨识方法[J]. 电工技术学报, 2022, 37(9): 2170-2178.
    [24] 王立宪, 马宏忠, 戴锋. 基于机电联合的GIL局部放电趋势预测研究[J]. 电子测量与仪器学报, 2021, 35(10): 98-106.
  • 加载中
图( 7) 表( 1)
计量
  • 文章访问数:  2413
  • HTML全文浏览数:  2413
  • PDF下载数:  841
  • 施引文献:  0
出版历程
  • 收稿日期:  2023-05-08
  • 刊出日期:  2024-01-20

一种可解释人工智能(XAI)在测量设备故障诊断和寿命预测中的应用

    通讯作者: 吴达雷,高级工程师; 
    作者简介: 陈长基,工程师,主要从事电能计量研究
  • 1. 海南电网有限责任公司,海口 570100
  • 2. 北京邮电大学 自动化学院,北京 100876
基金项目:  国家重点科技项目(2020YFB0906003);中国南方电网有限责任公司科技项目(070000KK52200021)

摘要: 

基于人工智能算法的变压器故障诊断和寿命预测模型在提高准确率方面已经达到了很好的效果,但是仍存在泛化性能较低,对数据质量要求过高,判断结果无法解释等问题. 该文基于DBSO-CatBoost模型,提出一种可用于故障判断解释的变压器故障诊断方法. 该方法基于数据特征提取,采用差分变异头脑风暴优化(DBSD)算法对CatBoost模型进行优化和故障诊断. ①对于数据预处理,引入比率法在原始数据中添加特征;采用基于可解释人工智能(XAI)的Shapley加法解释(SHAP)技术进行特征提取,并采用核主成分分析算法对数据进行降维. Shapley加法解释技术可根据特征贡献解码每个预测来帮助全局解释并评估预测结果. ②将预处理后的数据输入到CatBoost模型中进行训练,并采用差分变异头脑风暴优化算法对CatBoost模型的参数进行优化,从而得到最优模型. ③利用得到的优化模型诊断变压器故障并输出故障类型与预测结果. 实验使用来自中国国家电网公司西北部某电网的真实数据评估该模型. 结果表明:该文模型在不同故障诊断中的准确性最佳,平均准确率高达99.29%,证明该文方法可以有效提高电力变压器故障诊断的准确性和效率.

English Abstract

  • 开放科学(资源服务)标识码(OSID):

  • 变压器是发电、输电和配电中不可缺少的设备,而且成本很高,占据当代电网中大量的资本支出,不仅需要巨大的财政投资,而且还决定着整个电网运行的可靠性和稳定性[1]. 因此,公用事业公司必须优先考虑故障预防并维持电网的最佳运行状态,将这些资产保持在最佳和高效状态是全球许多电力公司的首要任务. 事实上,这些公用事业公司年度预算很大一部分分配给了这些资产的状态监测和维护. 因此,状态监测和资产管理是所有电力供应商关注的一个关键问题. 由于典型的电网部署了数千台变压器,因此状态监测成为了一项劳动密集型和耗时的工作[2-3].

    最近的研究表明,许多变压器达不到25~35年的预期寿命. 例如,在肯尼亚年度多达10%~12%的配电变压器过早退役. 而在工业化程度较高的国家,年度配电变压器退役率在1%~2%之间. 随着高压和超高压输电技术的快速发展,电网容量不断增加,覆盖范围不断扩大,如果不能及时准确地发现电力变压器的故障,将对电网瘫痪产生严重的负面影响,阻碍社会经济的正常发展[4-5]. 因此,电力变压器故障诊断及寿命预测研究对电力系统的发展具有重要意义[6].

    随着人工智能的高速发展,通过寻找数据本身内在规律并利用人工智能算法进行数据发掘的方式,为电力变压器参数预测及故障诊断提供了新的解决思路和技术手段. 机器学习与深度学习可以在预测和分类方面提供出色的性能,然而具有网络结构的模型内部参数无法解释,因此这些算法缺乏实际意义. 近年来,可解释人工智能(XAI)成为一个热门领域[7]. XAI的主要目的是让用户相信机器学习可以提供可靠的预测,并使机器学习方法更加透明. 当模型预测错误时,解释可以帮助跟踪原因和现象.

    解释模型预测之所以如此重要的原因有两个. ①可以提供有关模型可靠性的信息. 当分类器预测用可解释和透明的方式解释时,用户可以信任黑盒模型的结果,并且分类器在实际工业过程中的适用性是可能的. ②可以基于解释采取适当的操作. 在故障发生后,使工艺操作恢复正常尤为重要. 模型结果说明可用于执行此类还原或更正操作.

    现阶段有两种常用的方法来解释模型的预测结果. ①使用可由模型本身解释的分类器. 最常见的模型是线性回归、广义加性模型(GAM)和决策树(DT)[8-10]. 训练模型的结构可用于解释这些模型预测. ②使用与模型无关的解释技术来解释预训练模型. 该方法具有适应性强的优点,适用于任何黑盒模型. 局部可解释模型不可知解释(LIME)[11]和Shapley加法解释(SHAP)[12]是该技术常用的两个方法.

    针对各种基于高分类性能数据的故障诊断模型无法对预测结果进行解释的现状,本文提出一种可解释的故障诊断预测模型框架,构建了多种分类识别模型,并对多个模型进行了比较,最后建立了更适合变压器故障诊断预测的最优模型. 该研究框架使用SHAP提取训练数据的全局解释,有助于使用博弈论方法解码训练的AI模型行为. 这种解释也可用于提升基于机器学习系统的性能和可信度,同时本文模型对变压器目前运行状况的诊断,可为其剩余寿命的估算及下一步使用流程提供指导意见.

  • 变压器的油中溶解气体分析(DGA)是变压器寿命估计和故障诊断的重要依据. 变压器在正常运行及故障初期,其内部绝缘油及有机绝缘材料会随着运行时间增加而在热和电的作用下逐渐老化和分解,产生少量的低分子烃类、CO2、CO等气体和水分,这些气体绝大部分都溶解于油中,因此变压器油中溶解气体分析被公认为是一种探测变压器初期故障和估计绝缘寿命的有效手段. DGA能可靠地测量变压器运行状态,并广泛用于日常维护与寿命预测[13-14],该步骤相当于一个调查过程,检查从油浸式变压器收集的油样是否有故障气体,而气体浓度、比例和类型则说明变压器的内部状况. 绝缘油不仅具有冷却装置和熄灭电弧等功能,更重要的是它还可以溶解由于纤维素变质或环境中的水分而产生的任何气体. 变压器装置早期失效的一个常见原因是绝缘油变质. 据估计,变压器中大约70%~80%的故障本质上是初期故障,因此检测这些故障的任何操作都可能以类似的幅度减少电网上的故障表现.

    DGA解释的经典方法包括Key Gases、Duval和Nomography[15]. 几十年来,DGA数据的解释一直依赖于这些经典方法. 但是,这些经典方法往往依赖人类专家的经验、判断和直觉,而不是技术公式. 这种对人类的依赖常常导致对故障严重性的不确定评估,或者在极端情况下完全错误的识别.

    以往的学者进行了多项研究,以探索电网自动故障查找的新方法. 例如,学者们设计了一种基于智能模糊强化学习的变压器故障分类器[16]. 结果表明与其他方法相比,该模糊强化学习技术具有较高的准确率. 然而,模糊逻辑模型在接受新数据时往往表现不佳. 还有些学者在多层感知器(MLP)网络讨论了使用模糊类定义的边界[17]. 该模型以Duval Pentagon和Gas Ratio组合为中心,多层感知器网络在实际DGA记录上进行训练,并特别标记了故障情况. 文献[18]评估了K最近邻(KNN)算法和朴素贝叶斯方法通过DGA数据分析诊断变压器油绝缘的特征. 研究中使用了4个输入向量,即Duval三角报告、Dornrenberg比率、Rogers比率、DGA数据映射到4个输出类别. 结果表明当考虑Duval的三角报告时,KNN算法通常比朴素贝叶斯方法表现更好,准确率更高. 当数据集中存在多个故障条件时,基于比率的解释方法可能无法做出准确推断. 为了纠正这个问题,文献[19]除了应用自动化和标准化DGA解释技术外,还引入了一种增强方法来克服保守DGA分析实践的局限性. 使用基因表达编程构建专家系统,结果表明该方法比目前使用在工业实践中采用个别传统技术的其他方法具有更高的可靠性.

    随着人工智能技术的不断发展,神经网络和智能方法也开始在故障诊断领域中发挥作用. 何清波等[20]提出一个建议,通过安装一个传感器网络来覆盖配电网络的主要电力电缆. 该设置涉及在沿线每个维护孔中安装一个网络节点,此节点包括一个单独环绕每根电缆的电流互感器. 电流互感器允许同时进行连续测量和非侵入式通信,结果表明由该方法获得的多个变量(特别是湿度和温度)可用于模拟电缆老化. 宫文峰等[21]将群体优化技术和人工神经网络(ANN)相结合,用于预测变压器故障. 人工神经网络是对难以明确描述的关系进行建模的好方法,进化粒子群优化(PSO)算法模仿了鸟类如何成群结队或鱼群聚集在一起的自然行为,ANN算法和PSO算法的实现是用MATLAB编程语言完成的. 将几种PSO算法与ANN算法相结合时的功效与实际故障诊断的实验结果进行比较,结果表明进化PSO算法的准确率最高,达到98%. Cheng等[22]将优化后的BP神经网络与DGA方法相结合,在一定程度上提高了变压器故障检测的准确性,但是该方法仍然存在缺陷(如训练速度慢、参数确定困难等). 赵书涛等[23]对PSO算法进行了改进,然后将其与支持向量机相结合来识别故障并诊断. 对影响PSO算法的不同因素进行测试和评估,以确定具有最高准确度的值,结果表明PSO结合支持向量机的方法具有最好的平均精度. 然而,当故障类型多且信息缺失时,容易导致该方法精度不高. 王立宪等[24]采用极限学习机进行变压器故障诊断,表现出学习速度快、泛化性能高等优点. 但是,在诊断过程中隐藏层神经元容易出现冗余和分类精度下降等问题.

  • 为了诊断变压器故障及寿命预测,本文利用基于XAI的SHAP方法将预处理后的数据输入到CatBoost模型中进行训练,并采用DBSO算法对CatBoost模型的参数进行优化,得到可根据特征变量来解释变压器故障类型的最优模型——DBSO-CatBoost模型(图 1).

    基于DBSO-CatBoost的变压器故障诊断预测模型主要包括数据预处理、DBSO优化和故障诊断及寿命预测. 数据预处理主要包括DGA数据的特征提取、数据降维和数据归一化. DBSO优化部分利用DBSO算法优化CatBoost模型的多个参数,以获得最佳参数. 故障诊断及寿命预测部分是诊断和预测CatBoost模型,同时输出变压器故障类型,从而进行评估.

  • 集成学习通过构建多个机器学习器,训练它们形成多个弱学习器,并通过一些组合策略组合多个弱学习器,形成一个强学习器. 图 2为集成学习原理增强框图.

    该算法是集成学习的框架算法,其基本思想是利用基本分类弱学习器,通过线性加权和迭代训练得到强学习器.

    梯度提升决策树(GBDT)算法是一种基于提升算法的集成学习算法,结合了梯度提升算法和决策树的优势. 该模型为加性模型,学习算法为正向逐步算法,基函数为分类回归树(CART).

    因为GBDT算法中的预测模型由训练样本的目标变量确定,存在偏置点态梯度估计导致的过拟合问题,而CatBoost算法是基于GBDT框架的改进方法,可以有效解决上述问题.

    与其他GBDT算法(如XGBoost和LightGBM)相比,CatBoost在许多方面进行了优化. ① CatBoost采用“有序原则”,避免了GBDT算法迭代中固有的条件位移问题,同时可以利用整个数据集进行训练和学习. ② CatBoost将传统梯度增强算法转化为有序提升算法,从而解决了迭代中不可避免的梯度偏移问题,提高了泛化能力,降低了过拟合的可能性,增强了模型的鲁棒性. ③ CatBoost通过贪婪策略构建分类特征组合,并将上述组合作为附加特征使模型更容易捕获高阶依赖关系,更显著地提高预测精度. 此外,CatBoost选择遗忘决策树作为基本预测周期,从而降低过度拟合可能性,提高模型执行速度. 将数据集设置为:

    式(1)中,x=1,2…tt是样本组的数量. 相应的样本组$ I_x=\left(i_x^1, i_x^2 \cdots i_x^w\right), i_x^w$x组样本的第一个特征向量. Jx表示标签值. CatBoost算法的主要方法包括:随机生成多个排名进行学习、在相应特征下找到相同的类样本、计算分类特征转换值.

    式(2)中,φ表示指标函数,当满足$ \left\{i_y^z=i_x^z\right\}$时为1,否则为0;Jy表示标签值;u是先验值;α是先验权重.

    相应的样本组Ix在训练集中有一个模型,通过训练其他训练集而获得的模型没有Ix.按照贪婪策略构建分类特征组合,选择树结构. 采用有序提升算法计算梯度Ix,并使用梯度来训练弱学习器. 此外,最终模型通过加权开发获得.

    在默认值下,受CatBoost模型某些参数的影响会出现过度拟合或欠拟合问题,如果手动调整找到最佳值将非常耗时. 为此,本文采用DBSO优化算法对CatBoost模型参数进行优化,提高诊断模型的性能.

    DBSO算法表现出与经典头脑风景优化(BSO)算法相同的整体结构,应用差异突变,去除其中的高斯突变.

    BSO算法采用的是高斯突变,新个体的生成方程表示为:

    式(3)中,itd表示新的d维个体;isd表示选定的个人;T(0,1)d表示d维标准正态分布;ξ是高斯函数的系数.

    式(5)中,Nn分别表示最大迭代次数和当前迭代次数. z可以调整斜率lg sig函数,R(0,1)是0~1之间的随机值.

    由于高斯变异的变异系数在后续阶段趋于固定,不能很好地捕捉搜索特征,因此DBSO算法采用差分突变.

    在人类的头脑风暴中,每个人在早期的想法都会明显不同,在创造新的想法时应考虑现有想法的差异. 因此,DBSO算法通过差分突变确定突变步骤.

    式(5)中,j表示新生成的个体;R表示0~1之间的随机数;BdLd表示搜索空间的上限和下限;ur是开近似集;rand()表示生成随机数的函数;i表示选定的个体;igih表示在全球选定的两个不同个体.

    根据式(5),与高斯突变相比其差分变异的计算量显著减少. 通过遵守群体中个体的分散度,可以自适应地调整变异,从而更有效地共享信息并提高搜索效率. 因此,与BSO算法相比,DBSO算法能够更好地平衡局部搜索和全局搜索,提高算法性能.

    CatBoost是一个支持分类变量的机器学习库,符合GBDT算法框架,它能有效地解决原GBDT中的各种数据迁移问题,同时表现出参数少、精度高、鲁棒性好等优点.

  • 本文研究数据由中国国家电网公司西北部某电网提供,选择B2CB4C2B6C2B4C2B2作为变压器故障诊断的属性,包括555组故障数据. DGA数据中任何差异较大的单个特征都无法准确地确定变压器的故障类型,并且数据特征属性之间存在一定的耦合关系,因此需要提取数据特征.

    根据GB-T 7252-2016《变压器油中溶解气体分析与判断导则》,变压器绝缘油产气率与变压器故障类型相关,即变压器故障类型与各气体浓度之比相关. 因此,变压器故障类型特性与输入属性之间的比率也相关. 常见的三比值法和非编码法可以独立地确定变压器故障类型,因此输入属性交互比法产生的特征变量对变压器故障诊断数据产生了解耦作用.

    常见的三比值法和非编码法可以分别确定变压器的某种故障类型,而它们产生的特征维数不能完全解耦数据. 为了达到更好的解耦效果,本研究选择遍历数据属性比,所选数据特征变量主要由组分浓度及遍历比组成. DGA数据具有五维属性,因此数据属性的交互比例表示如为:

    式(6)中,T3T4T5T6表示DGA数据的任何不同属性;T1T2表示DGA数据的任何属性(T1T2). 利用枚举算法,通过遍历4组的所有排列组合,得到新的145维特征变量,并将原来的5维特征变量添加到150维的数据特征变量中.

    由于采集的DGA数据中部分数据为零,采用比例法添加特征属性实现了零除的情况,因此会产生异常数据.

    总的来讲,异常数据的处理方法包括Laida准则填充和固定值填充. DGA数据过于分散,而且数据水平差异很大. 使用Layida标准填充将消除大部分数据,因此这种方法不适用于DGA数据. 本文采用定值填充法对异常数据进行处理.

    每个150维数据特征变量对样本的贡献不同,一些变量的添加有时会增加模型的复杂性,同时影响模型的准确性. 因此,本文使用SHAP值方法进行特征提取.

    SHAP值方法构建解释模型,核心思想是计算特征对模型输出的边际贡献,然后从全局和局部层面解释黑盒模型,所有功能都被视为“贡献者”. 对于相应的预测样本,模型生成预测值,并且SHAP值是分配给样本中相应特征的值.

    针对150维特征变量计算各特征的SHAP值,并制作特征密度散点图(蜂群图). 蜂群图中的相应行表示一个要素. 在大范围内收集了相当多的样本,一个点代表一个样本. 纵坐标数是SHAP值,横坐标数表示样本名称(图 3).

    图 3中的横坐标按SHAP值平均绝对值降序排序,将中间温度过热类别的前10个特征作为蜂群图. 数字1,2,3,4和5分别表示B2CB4C2B6C2B4C2B2. 图 3显示C2B2的SHAP值平均绝对值最大,C2B2对样本的分类影响最大. 此外,B2CB4C2B6C2B4对样本分类也非常重要.

    蜂群图仅可视化一个类别中所有样本的SHAP值,并不代表整个模型的可解释性. 针对本研究的多分类情况,取各分类中SHAP平均绝对值的平均值,得到SHAP的总体平均绝对值,并利用样本特征影响直方图.

    在直方图中,相应的列表示一个要素. 横坐标按SHAP值平均绝对值降序排序,纵坐标为特征SHAP平均绝对值与所有特征SHAP平均绝对值的和之比. 折线图表示前60个特征时,先前特征累积的SHAP平均绝对值与所有特征的SHAP平均绝对值之和(图 4).

    图 4可知,C2B2的SHAP平均绝对值最大,对数据分类影响也最大. 图 4中前30个累积SHAP的平均绝对值占了近90%,所以本文将这30个平均绝对值作为样本数据的特征. 相应的样本在特征提取后有30个特征,由于总共有555个样本,数据维度仍然太大,而数据维度太大会增加模型的复杂性,因此数据维度应该减少.

    常见的降维算法是主成分分析法(PCA)、核主成分分析法(KPCA)和偏最小二乘法(PLS).

    主成分分析法(PCA)将原始变量映射到新的变量空间. 在新变量空间中,可以使用几个变量来替换原始变量,并且尽可能保留原始变量的数据内容. 新变量彼此正交以消除原始变量的共线性.

    核主成分分析法(KPCA)通过将原始数据映射到更高维空间来实现数据的非线性映射,然后采用主成分分析法从高维减少数据的线性维数.

    通过采用PCA,PLS和KPCA几种方法缩小数据维度得出的结果显示,KPCA法累积贡献明显高于其他降维算法,因此本研究采用KPCA法对数据进行降维.

    DGA数据差异较大,影响模型的处理速度,因此需进行数据归一化处理. 本文采用区间值法对数据进行归一化,使数据按比例缩放到特定区间,避免值之间的相互作用. 本文选择极值方法进行线性函数变换:

    式(7)中,Ix(d)(x=1,2,…,t)表示规范化数据,映射间隔为[-1, 1]. Ix表示原始数据;maxIx表示数据样本中的最大值. minIx表示数据样本中的最小值.

    最后,将降维后的归一化数据输入到训练和测试模型中.

  • 对数据样本进行筛选,得到局部放电(PD)65例,低温过热(LT)(<150 ℃)361例、低温过热(LT)(150 ℃~300 ℃)40例、电弧放电(AD)89例. 对于这些数据样本,本文使用400组数据作为训练集,其余数据集作为测试集. 利用MATLAB(R2019a)对采集到的555组电力变压器故障数据进行仿真实验.

    采用不同方法将本文模型与BP神经网络模型(BPNN)、化核极限学习机模型(KELM)及基于改进遗传算法和支持向量机的混合模型(IGA-SVM)进行比较,评估本文DBSO-CatBoost模型的稳定性与优越性.

  • 为了评估本文方法在电力变压器故障诊断中的有效性,将本文方法的分类准确性与其他3种方法进行比较. 实验计算得出的分类精度结果如图 5所示.

    图 5可知,在所有诊断模型中本文DBSO-CatBoost模型的故障检测和预测准确率最高,进一步表明DBSO在优化CatBoost模型方面有明显改进. 针对4种类型的故障诊断预测结果,本文模型在低温过热LT(<150 ℃)上的预测准确率是97.17%(106/106),在低温过热(LT)(150 ℃~300 ℃)上的预测准确率是100%,在局部放电(PD)及电弧放电(AD)上的预测准确率均为100%. 由实验结果可知,本文模型的平均准确率达到99.29%. 因此,与其他诊断模型相比,本文模型更适合于电力变压器故障检测和预测.

    均方误差(MSE)作为模型的另一个重要诊断指标,可以直接表示模型输出与理想输出之间的误差. 因此,为了探究本文模型的优越性,将MSE与上述4种模型进行比较(图 6).

    图 6可以看出,本文DBSO-CatBoost模型测试集的MSE最小. 当使用DBSO优化CatBoost并将测试样本作为CatBoost模型的输入时,该测试集的MSE仅为0.047,性能远远优于其他模型. 由于存在一些噪声数据,训练样本的MSE性能不是最优. 但是,结合图 5可知,本文模型仍然获得了诊断准确性,这也从侧面证明了本文模型具有非常高的鲁棒性.

    为了探究迭代次数对本文模型诊断精度的影响,将本文模型在4种类型故障下的准确性做了计算分析,并分别计算了模型在迭代次数2,4,6,8时的故障诊断准确性,结果如表 1所示.

    表 1可知,当迭代为次数4时,模型对4种故障诊断的平均准确率最高. 实验结果证明本文DBSO-CatBoost模型适合电力变压器的故障检测和预测.

    为了进一步了解本文模型的适应性能,将本文模型与其他3种模型进行收敛性对比. 实验结果如图 7所示.

    图 7的自适应曲线表明,DBSO-CatBoost算法的收敛速度非常快,且可以快速跳出局部最优,体现了该算法的高效率. 值得注意的是,该算法的初始误差较小,表明该算法的初始值接近全局最优值.

  • 针对传统方法故障诊断精度低、分类效果差及无法解释等问题,本文提出一种可对其行为进行解释的DBSO-CatBoost模型用于电力变压器故障诊断与预测. ①通过特征提取、数据降维和数据归一化对变压器绝缘油中的溶解气体数据进行预处理. ②建立DBSO算法优化的CatBoost模型. ③使用DBSO-CatBoost模型对处理后的数据进行训练和测试. ④利用DBSO-CatBoost模型确定变压器的运行状态,用于诊断变压器故障并预测寿命情况. 通过仿真验证了本文方法的鲁棒性和有效性. 为了提高用户对预测结果的信任,在预处理阶段使用SHAP值方法来提取完整的模型响应(全局解释),增加了预测结果决策方法的透明度和可信度. 因此,本文方法基于DBSO-CatBoost故障识别技术具有很高的可信度,对变压器故障判断解释及寿命预测研究具有较好的应用价值. 然而,本研究电力变压器故障诊断主要采用DGA数据,而工程实际中还存在许多其他可测数据与电力变压器运行状态息息相关,如局放量、含水量、电气试验数据等. 不同类型的故障,需要不同的方法来解释. 因此,未来的研究目标是进一步改进解释方法或通过使用可视化方法,在更扩展的数据集中涵盖更多类型的故障,以便提供适合各种故障的解释,并有效地向最终用户传达信息.

参考文献 (24)

目录

/

返回文章
返回