

牵引变流器是列车电气系统的重要组成部分,它能否安全稳定地运作关系到整个列车能否正常运行。
而牵引变流器的温度则是其中一个我们需要关注的要点,柜体温度检测和异常判断算法能直接反映牵引变流器的温度是 否还处在一个安全的范围中。

当前列车的牵引变流器的柜体温度的异常判断准则比较简单:通过阈值进行判断,即高于某个温度值则视为异常。

但是这种方法存在如下的缺点:当阈值过高时,对温度不敏感,准确率较低;而阈值较低时,误报率较高。牵引变流器的柜体温度与外界环 境、列车的工况等因素有关,通过这种简单的阈值判断,不能准确的反应牵引变流器柜体温度的状态。

柜体温度异常检测算法的技术要点
柜体温度异常检测算法的技术思路 本文采用了一种综合当前时刻的牵引变流器冷却系 统的温度和压力、列车速度、室外温度、牵引变流器的电压 和电流等变量作为输入的回归算法计算温度预测值。

通过 将测量温度与预测温度对比判断当前时刻牵引变流器柜 体温度是否发生异常,规避了现行的方法不能准确根据实际运行环境情况来判断牵引变流器柜体温度的状态的缺 陷,有更优秀的实用价值。

标动变流器采用水冷和强迫风冷系统,水泵将水从水 箱抽出来通过进水口进入整流、逆变等模块冷却水管,带走整流、逆变等模块热量后进入热交换器,通过冷却风将热量排向车外,被冷却后的水进入水泵循环,如图1所示。

图1 牵引变流器结构
牵引变流器柜体内部包含四象限整流器、逆变器、辅助逆变器和冷 却 系 统 等 装 置,采 用 M20螺栓吊装在车体底部。
牵引变流器的主要热源是包含逆变器与整流器的逆变模块,主要依靠水冷与强制风冷散热。水冷方式中冷却水

通过散热器与功率模块进行相对较迅速的热交换,在一定程度上反映功率模块的温度。由于柜体温度低于冷却水出口温度,因此柜体温度为变流器柜体内空气温度,非功率模块热点处温度。
并且由于热交换的迟滞性,柜体空气温度变化相比冷却水温度代表的功率模块温度存在滞后性,对柜体温度的回归需要提取前一段时间的温度变化信息。

从列车上可获得的数据是一个时序序列,时序序列包括多个变量:牵引变流器冷却系统的温度和压力、列 车 速度、室外温度、牵引变流器的电压和电流、牵引变流器柜体温度。
而其中与柜体温度相关的参数包括列车当前的运行状态与柜体内所有热点的温度。

根据牵引变流器冷却系统前一段时间的温度和当前时刻的压力、列车速度、室外温度、牵引变流器的电压和电流等变量,将其作为输 入,采用回归算法计算系统在当前时刻牵引变流器柜体温度在正常状态时的预测值(回归模型计算得出)。

回归模型计算出的牵引变流器柜体温度预测值的含义为在当前工况下,牵引变流器柜体温度在正常状态时的值。
因此当牵引变流器柜体温度的实际值与预测值相差较大时,可以认为牵引变流器柜体温度发生了异常,具体方法是通过计算牵引变流器柜体温度预测值与实际值之间的残差,根据异常判断准则,判断当前时刻牵引变流器柜体温度是否发生异常。

1.2 柜体温度异常检测算法的结构
牵引变流器柜体温度异常检测算法的技术思路:根据 当前时刻的牵引变流器冷却系统的温度和压力、列 车 速 度、室外温度、牵引变流器的电压和电流等变量。
将其作为输入,采用回归算法计算系统在当前时刻牵引变流器柜体 温度在正常状态时的预测值(回归模型计算得出)。

回 归 模型计算出的牵引变流器柜体温度预测值的含义为在当 前工况下,牵引变流器柜体温度在正常状态时的值,当牵引变流器柜体温度的实际值与预测值相差较大时,则可认 为牵引变流器柜体温度发生了异常。
通过计算牵引变流 器柜体温度预测值与实际值之间的残差,根据异常判断准 则,判断当前时刻牵引变流器柜体温度是否发生异常。

牵引变流器柜体温度异常检测算法结构如图2所示, 包括4个模块:数据处理、模型建立、模型训练、预测。

1.2.1 数据处理模块 数据读取:用于读取并提取模型训练和预测所需的输 入变量、输出变量数据; 数据预处理:采用移动平均对温度数据进行平滑,去 除数据中不合理的波动;

数据重构:按照 训 练/预测输入格式要求转换数据格 式,生成时间轴上的滑窗训练数据集; 训练集/测试集划分:将所有牵引变流器在正常状态 时的运行数据划分为训练集和测试集,训练集用来训练生 成回归模型的参数,测试集用来测试回归模型的性能。

模型建立 采用 XgBoost算法建立牵引变流器柜体温度的回 归 模型。XgBoost(eXtremeGradientBoosting)全 名 叫 极 端 梯度提升,Boosting是一族可将弱学习器提升为强学习器 的算法。

这族算法的工作机制类似:先从初始训练集训练 出一个基学习器,再根据基学习器的表现对训练样本分布 进行调整,使得先前基学习器做错的训练样本在后续受到 更多关注。
然后基于调整后的样本分布来训练下一个基学

习器;如此重复进行,直至基学习器数目达到事先指定的 值 T,最终将这 T个基学习器进行加权结合。

XgBoost算法处理多分类问题时,可以当做多个二分 类问题,也 可 以 使 用 softmax 回归得到的概率来计算 损失:



其中:

表示树结构的优劣程度,这 个 值 越 大 越 好。
在寻找最优分割方法时,采用严格贪婪算法,令 增 益

使 Gain尽可 能大,具体来说对每个 特 征,将其取值从小到大进行排列 然后计算利用每个值作为分割点 的 Gain,找 到 Gain最 大 的分割点。
实验 结 果 证 明 XgBoost相对其它深度学习方法过 拟 合有所减轻,测试集准确 度 高,而 利 用 XGBoost提 取 特 征 并增强后配合较为简单的分类器也能达到较好的效果[1]。

1.2.3 模型训练 接受训练集与验证集对模型进行训练,利用交叉验证 确定最优参数,并保存最优模型结果。并根据残差的分布 及3σ原则,确定牵引变流器柜体温度残差的异常边界。

1.2.4 预测模块 加载训练完成的模型,调用模型对牵引变流器柜体温 度进行回归,并计算当前时刻牵引变流器柜体温度预测值 与实际值之间的残差,并绘制残差图。根据牵引变流器柜 体温度残差异常边界,判断当前时刻牵引变流器柜体温度 是否发生异常。

柜体温度异常检测算法的主要流程
牵引变流器柜体温度异常检测算法的训练和使用流 程如图3所示。

2.1 算法训练部分
步骤1:数据处理模块加载列车在正常状态的实际运 行数据;
步骤2:对数据预处理、进行数据重构;
步骤3:将数据划分为训练集和测试集;
步骤4:导入到回归模型中,进行模型的训练;
步骤5:得到回归模型的参数和牵引变流器柜体温度 残差分布的异常边界。

2.2 算法使用部分
步骤1:数据处理模块加载列车当前时刻的实际运行 数据;
步骤2:对数据预处理、进行数据重构;
步骤3:将数据导入回归模型中,回 归 模 型 加 载 训 练 好的模型参数;
步骤4:计算牵引变流器柜体温度的预测值与实际值之 间的残差,根据牵引变流器柜体温度残差分布的异常边界, 判断当前时刻,牵引变流器柜体温度是否处于异常状态;
步骤5:给出异常检测结果。

柜体温度异常检测算法的结果示例
以2089列2月7日9-14时数据与2017列6月9-12时数据为例,结果如图4、图5所示。

预测结果图是对目标对象使用了牵引变流器柜体温 度异常检测算法并进行实际温度测量,得到温度预测值和 实际值的对比图,其中蓝色曲线为牵引变流器柜体温度回 归模型计算的预测值,红色曲线为实际值。

预测残差图是求预测值与实际值二者残差,绘制残差 曲线得到的。
判断结果图则是依据温度残差分布的异常边界判断 当前残差来判断系统是否异常,依据判断结果绘制而成。


总结
本文介绍的牵引变流器柜体温度检测异常算法采用 了综合当前时刻的牵引变流器冷却系统的温度和压力、列 车速度、室外温度、牵引变流器的电压和电流等变量作为 输入的回归算法计算温度预测值。
通过将测量温度与预测 温度对比判断当前时刻牵引变流器柜体温度是否发生异 常,规避了现行的方法不能准确根据实际工况来判断牵引 变流器柜体温度的状态的缺陷,具有优秀的实用价值。
参考文献:
[1] 基于随机森林和XGBoost的铁路工期指标预测方法研究[J]. 寇智聪.电子元器件与信息技术,2022(04)
[2] 基于XGBoost算法的大型活动期间轨道进出站量预测[J]. 付宇;翁剑成;钱慧敏;蒋锦港.武汉理工大学学报(交通科学与工程版),2020(05)
[3] 基于XGBoost的轨道交通短时客流预测精度分析[J]. 孙晓黎;马超群;朱才华.交通科技与经济,2021(01)
[4] 基于XGBoost的城市轨道交通短时客流预测[J]. 张杉基.青海交通科技,2020(01)
[5] 基于XGBoost模型的地铁列车运行状态仿真方法[J]. 门元昊;吴亮;刘晓双;秦枭喃;罗森林.城市轨道交通研究,2022(03)
[6] 基于XGBoost的列控车载设备故障预测方法[J]. 刘江;许康智;蔡伯根;郭忠斌;王剑.北京交通大学学报,2021(04)