一、背景
如何制定产品的维修策略?通过维修是否能够提高产品可靠性?制定产品维修策略时是采用定期维修还是视情维修?能否直接使用已有的维修策略?...诸如此类问题,都是我们在制定产品维护计划、策略时需要考虑的问题。下面简单介绍制定产品预防性维修策略、计划时需要考虑的问题,以及建议。
建议1:接受故障的存在,维护不是解决所有的故障问题
首先,我们必须接受故障的存在。并非所有的故障我们都可以通过维护来预防,有些故障是我们无法控制的结果。例如,雷击或洪水。对于这样的事件,无论您使用多好的维护策略,都是无法避免这些事件的发生。但是,我们可以通过设计来减轻这样的事件的后果。
而对于由于糟糕的设计、糟糕的施工或糟糕的采购决策而导致的故障,维护也无能为力。
还有一些其他情况,由于故障的影响很小,不是我们不知道有故障,而是综合权衡之后,我们可能需要接受故障。
所以,好的维护计划并不能预防所有的故障。好的维护计划和程序是接受一定程度的故障,并准备好处理他们接受的故障。
建议2:不是所有的故障都是与老化有关的
我们学习过可靠性基本知识都知道,不是所有的故障都是与老化有关的,不是所有的故障都是与时间相关的。故障一般可以分为随机故障和系统性故障(老化故障、耗损故障等)。根据航空业的研究表明,70%-90%的故障模式与老化无关。相反,对于大多数故障模式来说,其发生的可能性是随机的。美国海军和其他人的研究报道都发现了非常相似的结果。关于各种类型产品的故障规律、寿命分布相关曲线、特征,可参阅相关资料。
通过故障规律分析可知,大多数故障是随机发生的,且早期失效情况很常见。而且它通常会持续一段时间。也就是说,产品的故障概率只有在一定的时间后才变为恒定。
不要将下图所示的随机故障的故障分布曲线理解为不会退化或磨损。一切产品都会随着时间而退化,即都是有寿命的。但是,许多产品退化非常缓慢,所以,磨损不是其主要的问题。这些产品在正常使用寿命内没有达到磨损区,所以,我们看到其故障规律都是没有磨损特则会那个,但是不代表他不会磨损。
历史上,维护是因为相信故障的可能性随着时间的推移而增加(第一代维护思想)。人们认为,及时的维护可以降低故障的可能性。结果表明,至少70%的设备并不如此。
对于故障概率恒定的70%的设备,没有必要执行基于时间的寿命更新任务,如维修或更换。
花费维护资源来服务或更换可靠性未降低的设备是没有意义的。或者说,维修任务不能提高可靠性。
实际上,这意味着70%–90%的设备将需要采取某种形式的状态监测,而只有10%–30%的设备可以通过基于时间的更换或大修来有效地管理。
然而,我们的大多数PM(预防维修)项目都是基于时间的替换和大修。这样的做法可能会带来不必要的资源浪费,提高了维护成本。关于如何根据产品故障模式、产品性能监测进行维修策略制定的研究较多,若需了解,可参阅相关研究资料。
建议3:故障模式要区分严酷度,不要千篇一律
在决定是否执行维护任务时,请考虑不执行该任务的后果。让这种特定的失效模式发生会有什么后果?
避免这种后果的发生是你维护计划的效益,是维护工作投资的回报。维护应该被视为一种投资的方式。因为制定了维护策略,您将承担维护成本,以换取持续的安全性和可靠性。和所有好的投资一样,收益应该超过最初的投资。
因此,了解故障的后果是制定良好维修计划的关键。
正如不是所有的故障都有相同的概率,也不是所有的故障都有相同的后果。
即使是同一类型的设备。例如一个泄漏的油箱。如果储罐中含有高度易燃液体,则储罐泄漏的后果是严重的。但如果水箱里装满了饮用水,后果可能就不太令人担心了。
除了设备失效的后果,你还需要考虑失效实际发生的可能性。
维护任务应针对主要的故障模式制定,应针对频繁发生的故障和后果严重但不太频繁或很少发生的故障。
维护计划应同时考虑故障的后果和可能性。由于风险=可能性x后果,我们可以得出结论,良好的维修计划是基于风险的。
好的维护计划使用风险的概念来评估在哪里使用我们的稀缺资源来获得最大的利益。我们最大的投资回报。
建议4:零部件可能会磨损,会导致产品失效
“零部件”通常是一个简单的组件,它的故障模式相对较少。例如汽车上的皮带、驱动轴上的滚柱轴承、起重机上的电缆。
这些零部件通常都会表现出潜在失效的早期信号。因此,我们通常可以设计一个测试/监测/检查工作任务,以便及早发现潜在的故障,并在故障之前采取行动。
对于那些确实“磨损”的零部件,超过一定年限后,其失效概率将大大增加。如果我们知道某个组件的典型磨损失效机理,我们就可以安排一个基于时间的维修任务,在发生故障之前对其进行更换。
当我们分析由许多“简单”零部件组成的复杂系统时,情况就不同了。
所有这些简单零部件都有自己的失效模式和失效模式。因为复杂系统包含如此多零部件,有不同的故障模式,他们通常不会表现出磨损失效特征。他们的失败往往不是时间的函数,而是随机发生的。它们的失效概率通常是常数,比如服从指数分布曲线。
大多数现代机械由许多部件组成,应视为复杂部件。这意味着没有明显的磨损。如果没有明确的磨损寿命,进行基于时间的大修是无效的。
只有在我们能够证明某个项目出现磨损大修的情况下,执行基于时间的大修或部件更换才有意义。具体是服从什么规律,可通过威布尔分析等手段,将历史数据、监测数据通过相应的PosWeibull威布尔分析工具判断。
建议5:隐藏故障必须找到,特别是安全保护系统的隐藏故障
隐藏故障是指在正常运行期间未被发现的故障。只有当您需要这些设备工作时,它们才会表现出来是否故障。或者当你进行一个测试来发现故障的时候才能发现。
隐藏故障通常与具有保护功能的设备有关。有点像高压遮断系统(跳闸)。像这样的保护功能通常情况是不起作用的,他们只需要在例外情况下发挥作用,以保护我们的人身安全,保护环境免受重大影响或保护我们的设备免受重大损害。我们平时可能更多关注被保护的设备本身,总是在具有保护功能的设备上执行故障检查任务。但是,没有找安全保护系统本身的故障。
很明显,故障检查任务并不能防止系统失效。相反,一个故障检查任务如其名字含义一样,就是找出故障。关于安全关键系统的功能安全系统分析,可通过PosVim的功能安全性分析模块进行分析。
我们必须找出隐藏的故障,并在要求设备运行之前加以修复。
建议6:相同的设备并不以意味着相同的维护策略
两个相同的设备并不意味着他们需要相同的维护。事实上,他们可能需要完全不同的维护任务。
典型的例子是两个完全相同的泵A、泵B在一个热备系统上工作(一个泵工作,另外一个泵备份),泵的制造商、型号都相同。两台泵在相同的操作条件下处理完全相同的流体。但泵A为正常工作的泵,B泵为备用泵。泵A正常运行,泵B仅在泵A故障时使用。
当谈到故障模式时,泵B有一个重要的隐藏故障模式:它可能不会按需启动。换句话说,当泵A故障或正在维修时,您突然发现泵B不会启动。泵B通常不运行,所以你不知道它不能启动,直到你来启动它。这是隐藏故障模式的经典定义。而隐藏的故障模式,需要一个故障查找任务,即您去测试泵B是否启动。但是,泵A不需要这样做,因为它总是在运行(除非它关闭或失败)。因此,在构建维护程序时,必须考虑操作环境。设备关键性的差异也会导致不同的维护需求。在关键性低的服务中,安全或生产关键设备需要比同一设备更多的监控和测试。必须注意相同设备可能需要不同的维护要求。这都是比较容易忘记或者忽略的地方。但是,当你忽略这个,会发现自己面临着严重的失败。尤其是如果您使用了预防性维护任务库,按部就班式进行维护要求的制定。