江苏省能源行业协会

您现在的位置：研究培训 > 专题研究专题研究

数据驱动的风电机组传动链故障迁移诊断技术

点击次数：2431次更新时间：2024/4/25 【关闭】

一、引言

大力发展风力发电是我国能源领域的重大战略任务，也是实现“双碳”目标和能源结构转型的必由之路。但是，受风速和风向的随机性、负荷的不确定性、以及长期恶劣运行环境的影响，风电机组故障频发。美国国家可再生能源实验室对风电装备零部件失效导致的停机维护时间进行了统计分析，累积分析了30200台风电机组的各类故障导致的平均停机维护时间，结果如图1所示。从图中可见，齿轮箱等传动部件失效导致的发电量损失占比最大。这是由于传动链结构紧凑且部件繁多，加之长期处在变转速、变载荷的工作状态，更提高了传动链部件故障发生的概率。因此，发展面向风电机组传动链的健康状态监测与故障诊断技术，有利于及时发现安全隐患、避免灾难性事故，对于保障机组安全运行和提高风电场的经济效益具有重要现实意义。

随着风电机组的监测传感器愈加密集，种类日益丰富，其监测数据规模呈现井喷式增长，风电运维进入“大数据”时代。其中，基于振动信号的监测与故障诊断方法应用最为广泛，相关理论成果丰硕。国内外的专家学者们基于谱峭度分析、盲解卷积、随机共振以及自适应分解等先进信号处理方法，开发出了多种用于风电传动部件故障诊断的算法。近年来，基于数据驱动的智能故障诊断相关研究层出不穷。然而，这些方法实现高性能诊断需要满足两个基本前提：（1）有足量且故障类别丰富的有标签数据用于模型训练学习；（2）待诊断的测试数据和用于模型学习的训练数据满足独立同分布的条件[7]。事实上，对于现役风电机组，上述前提往往很难满足。首先，设备通常不被允许长期带故障运行，因而难以获取大量各类型故障模式的数据。另外，机组运行工况复杂多变，其监测数据的统计特性也随之发生变化，从而出现新获取的待诊断数据与用于模型构建的数据间存在分布差异，以至于训练完备的模型在新数据上的分类预测与诊断性能严重下降。

在实际应用中，虽然获取待测设备的各类别状态数据较为困难，但通常存在若干其他可获取的标记数据，例如同类型其他设备、实验台、公开数据集或仿真模型的数据等。通过合理使用这些可获取数据（源域数据）来帮助目标任务（目标域）的学习，打破上述两个前提，实现跨分布数据（跨域）的高性能诊断，不仅具有更高的工程可实施性也是故障诊断更高水平智能化的体现，对于解决实际诊断问题和数据驱动方法在故障诊断中的应用推广均具有重要现实意义。

二、常见故障形式和数据特点

2.1 传动链常见故障形式

风电机组的传动链主要由主轴承、主轴、齿轮箱和联轴器等部件组成，是增速和扭矩传递的关键设备。主轴承常采用双列调心滚子轴承，齿轮箱则通常包括多级行星轮系和平行轮系，经多级传动后增速比可达1：99左右。受交变载荷和复杂工况的影响，滚动轴承和齿轮箱是整个传动系统中最易损坏的零部件。

滚动轴承的失效形式主要有金属表面剥落、滚道磨损、塑性变形、锈蚀、金属部件断裂、表面胶合等，其故障原因多样，可能引起振动和噪声增大，并最终导致轴承失效。齿轮箱的主要作用是将低速风能稳定地利用于发电，提高主轴转速。齿轮箱具有传动比大、传动功率大、布置紧凑等特点，常见的故障形式主要包括齿面点蚀、磨损、胶合、断齿、塑性变形、轴承损坏以及轴断裂等。

2.2 传动链监测信号特点

载荷大范围瞬时波动是风电传动链的典型运行工况，这种载荷波动直接导致传动部件的振动响应具有明显的强时变、非平稳性。此外，传动系统的多零部件结构导致了其复杂的多路传输路径调制模式。具体表现在局部损伤激发的故障冲击源与多个零部件的振动分量耦合或互相调制，使得测到的振动信号具有强烈的非线性。同时，低速重载的恶劣运行环境，以及风力机中的偏航系统、柔性支撑、液压系统等子系统会诱发多类噪声污染，使得故障响应变得极其微弱。这些因素都极大地增加了从原始信号中提取故障征兆成分的难度。还需指出的是，如引言中介绍，对于风电机组传动部件的振动信号而言，设备结构参数、运行工况、传感器安装位置（振动信号传递路径）、故障程度以及运行环境等因素的差异，都会使其统计特性发生变化。因此，无论是由于风的随机性导致机组运行工况频繁变化，还是在新投运机组的监测诊断场景中，待诊断数据都极有可能与已部署模型的训练数据存在分布偏差。这种情况会显著降低模型对测试数据的诊断准确率，增加误诊或漏诊的风险。

三、跨域智能故障诊断研究现状

迁移学习（TL）为实现分布偏差下的智能故障诊断提供了可行的技术支撑。TL是一种基于数据和任务的相似性，将在源域（源数据）中学习到的知识迁移并应用到另一个相似领域（目标数据）中的方法。通过放松训练数据和测试数据需要服从相同分布的限制，解决了目标任务训练数据不足的问题。此外，由于深度学习在特征提取方面的优势，更有利于挖掘隐藏在数据背后的故障本质信息。因此，基于深度迁移学习技术（DTL）的跨域智能故障诊断成为实现风电机组传动链运行状态监测的前景技术之一。

借助DTL跨领域、跨分布的知识挖掘和迁移能力，涌现出大量关于跨域智能诊断方面的研究。它们针对不同跨域场景中的故障识别任务，构建了多种诊断模型，例如同设备跨工况场景、跨设备场景、仿真到实体（数字孪生）等。按照实际诊断任务中目标域数据的完备程度，现有跨域诊断研究涉及的场景主要可分为以下两种：目标域缺少数据标签和目标域数据不完备。

3.1 目标域缺少数据标签场景下的跨域诊断

该场景中将源域知识迁移到目标域的过程也可称为领域适应。通过将源和目标域数据投影到某个特征空间，并在该空间中学习与分布无关的域不变特征，从而缩小域间分布偏差，使得在源域建立的模型能够很好的用于目标数据诊断。Wang等利用并通过最小化源和目标域特征的最大均值差异（MMD）实现分布对齐，进行轴承的跨工况诊断。Li等将参数迁移、基于MMD的特征适配以及集成学习相结合，提出一种集成深度迁移网络用于滚动轴承的跨域故障诊断。Qin等将对抗领域适应网络用于行星齿轮箱的跨域故障诊断。不同于上述的特征全局分布对齐，Chen等利用局部MMD缩小源和目标域同类别数据间的分布距离以获取更细粒度的特征对齐。

上述研究主要关注单一源域到目标域的迁移策略，而在工程实际中，训练数据可以从多个来源获取。例如对于跨工况诊断任务，源域可以为多个不同历史工况的数据。多个来源的非同分布数据蕴含了更丰富且多视角的知识，为提升对目标任务的诊断准确率提供了可能。目前，已有部分研究工作对基于多源域适应的跨域故障诊断问题进行了探讨。

除上述方法外，一些特殊的领域适应方法也被用于解决不同场景下的故障诊断任务，例如部分域适应和开放集域适应，它们分别用于解决目标域标签空间是源域标签空间的子集和两者仅共享部分类别场景中的诊断问题。

3.2 目标域数据不完备场景下的跨域诊断

该场景中目标域没有可用于模型训练的数据，或是仅有正常状态数据，缺少故障数据。这种情况在工程诊断任务中十分常见，例如新投运的风电机组，其故障数据可能十分稀少，故障类别也不足。此外，风的随机性导致机组的运行工况连续变化，新出现的待诊断工况可能是从而见过的，其监测数据无法提前获取。这种情况下，由于没有类别、数量充足的目标样本用于引导特征分布对齐，3.1小节中的领域适应方法不再适用。目标域数据不完备的特点加大了构建有效的知识迁移策略的难度，也引发了工业应用对具有更高泛化性能的故障诊断模型的迫切需求。

Deng等提出一种基于阶次谱迁移的跨域诊断方法，其利用阶次谱建模和统计矩优化将目标域的故障特征迁移至源域分类模型中，从而降低对目标域故障样本的依赖。该方法以模型驱动为主，需要大量的故障机理和信号处理知识的支撑。从数据驱动的角度看，由于不同来源数据间的潜在分布差异是阻碍模型泛化的主要原因，因此从多个源域中学习与领域分布无关的共性特征是解决该问题的一条可行途径，该策略也是现有研究工作采用的主要方法。Zheng等利用Fisher判别分析将不同源域描述为Grassmann流行上的多个点，通过计算它们的平均子空间来学习共性判别结构，从而提高模型的泛化性能和实现对目标样本的模式识别。该研究团队还在文献中针对此场景提出一种基于先验诊断知识的跨域诊断方法，利用角域重采样和希尔伯特变换获取原始振动数据的包络信号，目的是消除监测数据中部分由运行工况等因素引起的特性差异，然后将其输入CNN进行故障诊断。为了充分利用源域数据的标签信息，Zhang等采用条件对抗训练对齐多个不同工况数据集的条件分布，从而学习它们的域不变特征，实现了对未知工况的诊断。在风电装机容量快速增长以及机组运行工况复杂多变的背景下，面向未知分布的监测数据的跨域故障诊断研究很好的满足了当前的应用需求，同时对于发展机组的实时状态监测与故障诊断技术也具有积极的借鉴意义。

四、结论与展望

早期风电装备的快速发展使得风电装备陆续进入故障高发期，传动链作为风电机组的重要组成部分，对其进行状态监测和故障诊断是保证机组稳定运行的关键。鉴于风电监测数据的分布特性，国内外研究者基于迁移学习提出了各种各样的跨域诊断方法和策略。但该研究领域方兴未艾，尚有许多科学和工程问题有待解决，仍需在以下方面开展大量研究。

（1）领域边界模糊情况下的跨域诊断研究

现有跨域迁移诊断研究大多基于不同分布数据有着明确领域标签的假设，即一段数据来自哪台设备或是哪种工况会被清晰标注。但是，风电机组运行工况频繁变化，其监测数据通常包含多种工况且边界模糊。因此可用于模型训练的数据内部分布混杂，不利于从中学习具有一致性判别能力的故障表征。这种没有领域标签的混合域迁移诊断是风电运行状态监测中值得研究的内容。

（2）分布式风电传动链故障诊断研究

单一风电场具有众多监测数据，但故障样本有限，难以支持数据驱动的诊断模型构建。虽然可以基于实验室模拟数据，利用本文介绍的迁移学习方法构建跨域诊断模型，但现有试验台通常与真实风电装备差异较大，导致迁移效果有限，而建立同规模的试验装置成本十分高昂。解决上述问题的一个可行方案是集中多个风电场的数据来训练模型，这种数据集中式建模也是当前数据驱动模型构建采取的主要方式。但在现代工业中，数据隐私问题至关重要。不同风电企业之间的数据共享通常是被严格禁止的，即使在同一企业内部，集中多个风电场数据也会受到有限通信资源的制约。因此，如何在数据非共享的约束下，构建可靠的跨域故障诊断模型是当前风电智能运维未来的发展方向之一。

作者：史曜炜南京邮电大学物联网学院邓艾东东南大学能源与环境学院

下一条：双碳”背景下推进新型储能产业发展的思考上一条：田庆军：乡村风电成就中国能源革命