论文部分内容阅读
伴随着我国高铁的快速发展,列车的运营安全问题显得尤为重要。轴箱轴承是动车组走行部的关键部件,目前我国高速列车主要对其温度状态进行监测,并基于设定的阈值进行预警报警。这种方法存在如下缺陷:适应性差、误报率高;对故障的判断主要依靠专家经验;列车行车累积的数据未得到充分利用。在修程修制方面,现阶段一般采用的是定里程维修和更换,这种方法可能导致“欠维修”和“过度修”等情况的出现。针对上述问题,本文综合考虑列车实际行车记录的运行时间、列车速度、环境温度等因素对轴温的影响及各因素之间的关系,应用机器学习的方法对监测数据进行深度挖掘处理,通过多种改进方法及模型的对比,最终提出了一种结合了综合采样的随机森林法,实现了轴箱轴承的故障预测,主要工作如下:(1)针对列车运维数据维度高、数据量大、数据质量低以及时间序列等特点进行研究,确定了数据预处理方案。首先选择相关特征数据并对数据进行清洗及整合,然后将数据按时间窗分割,在已分好的时间窗中选择、提取、构造特征,并关联故障记录为每组特征数据贴上对应的标签,最后对特征数据集进行标准化和降维处理,完成数据集的制作。(2)针对数据不平衡问题,分别从数据和算法两个角度提出不同的改进方法。数据层面:采用综合采样的方法,首先利用主动获取的方式对正常数据进行欠采样,然后采用Borderline-SMOTE过采样算法生成新的故障数据,最终使数据集达到平衡;算法层面:通过修改损失函数中不同类别的权重实现代价敏感学习。(3)通过对比实验提出最终的故障预测模型。首先利用基于Python语言的机器学习工具包Sklearn建立不同的机器学习模型,然后结合提出的两种数据不平衡的改进方法,建立对比实验,通过网格搜索中嵌套k-折交叉验证的方法对不同改进模型进行调优及评估,最终选择结合综合采样的随机森林法作为轴箱轴承的故障预测模型。最后利用预留的两次未经训练的故障数据对选择出的改进模型进行验证,该模型在故障出现前的6~7小时成功预测出了轴承故障,证明了该模型的有效性。本文提出的结合综合采样的随机森林模型可以实现高速列车轴箱轴承的故障预测,为故障的处理预留更多的时间,不仅能避免列车紧急制动,被迫低速运行导致列车延误的情况,提高旅客的出行体验,更能保障列车的行车安全,为优化修程修制提供参考。