1、前言
在开展可靠性工作时,我们经常会遇到不同删失类型的数据。那到底什么是删失数据?删失数据包含哪些呢?
例如,我们在开展可靠性试验过程中,往往会设置好一定的测试间隔时间,每间隔一段时间进行检测,这样所得到的数据往往属于间隔/区间删失数据。即我们只知道开始测试、结束测试时间,但是我们不知道具体是什么时刻样品出现了故障。我们平时开展可靠性分析工作时,经常说的故障数据,又是什么类型数据呢?包含删失数据吗?这里给大家详细介绍删失数据的类型及定义。
2、删失数据类型及定义
我们平时开展可靠性数据分析、威布尔分析工作时,主要遇到的数据类型包括完全数据/确切失效数据、右删失数据(包括I型和II型,也有一些资料提到III型)、左删失数据、间隔/区间删失数据、批量删失数据、成组删失数据、零失效数据等。
(1)完全数据/确切失效数据
完全数据/确切失效数据是我们明确知道样本是什么时候失效的。例如,可靠性试验时,共3个样本参加试验。试验过程中实时观察样本的情况。通过试验,记录下样本2的失效时间是100小时,样本1的失效时间是120小时,样本3的失效时间是150小时。
图1 完全数据/确切失效数据
(2)右删失数据
右删失的情况在可靠性工作中最为常见,也是我们经常默认的删失数据类型。也称为截断数据。右删失数据是指到观测时间点/试验结束时间点,样本仍未失效的情况。对于高可靠性的产品来说,在试验过程中经常发现右删失数据,即试验结束后,样品仍未失效。例如,我们测试3个试验样本,试验截止时间未1000小时。当试验截止时,我们检测3个试验样本呢,发现只有样本1、样本2失效,而样本3未失效(不知道什么时候才能发生失效),即样本3为右删失数据。
图2 右删失数据
需要注意的是,右删失数据一般又可以分为I型右删失数据、II型右删失数据。I型右删失数据是较为常见的,即到试验截止时间,仍未失效的数据即为I型右删失数据。例如,5个样本参加可靠性试验,试验截止时间T=1000小时。当试验进行到1000小时时,样本1、4、5仍未失效,这三个样本即为I型右删失数据。
图3 I型右删失数据
II型右删失数据是,假设我们选择5个样本进行可靠性试验,并预先设定好3个样本失效即停止试验。当我们试验到出现3个样本失效时,另外两个样本仍未失效,这两个未失效的样本即为II型右删失数据。
图4 II型右删失数据
(3)左删失数据
左删失可以理解为,我们知道某个故障事件(或其他事件)发生的时间小于某个数值,但我们无法确定具体的时间。例如,我们开展可靠性试验时,在1000小时的时刻测试时,该样本已经发生了失效,即知道该试验样本失效的时间小于1000小时,但是我们不知道确切是什么时刻发生的失效。也就是说,它发生失效的时间可能在0到1000小时之间的任意时间,但是我们无法确定具体数值。
例如,某可靠性试验选择3个试验样本进行可靠性试验,试验到1000小时时进行测试。当试验进行到1000小时时检测发现样本1失效、样本2失效,样本3未失效。此时,我们知道样本1、样本2的失效时间小于1000,但是由于试验过程中不是实时检测样本的情况,所以只能确定样本1、样本2的失效时间是0~1000小时之间。
图5 左删失数据
(4)区间/间隔删失数据
区间/间隔删失数据是指我们知道开始测试/观测的时间,以及结束测试/观测的时间。且我们知道样本是在开始到结束测试时间段中间发生了失效,但是我们不知道具体的时间点。这样的数据称为区间/间隔删失数据。例如,我们选择5个样本进行可靠性试验,每隔500小时进行测试。当500小时时,测试所有样本没有失效,当1000小时时测试所有样本,发现样本1、2、3都发生了失效,此时,样本1、2、3即为区间删失数据。
图6 区间/间隔删失数据
(5)批量删失数据
批量删失数据一般指右删失数据,即删失的数据量较多的情况。
(6)成组删失数据
成组删失数据一般是指我们可对删失数据进行分组,尤其是不同时间段进行测试时。
(7)零失效数据
零失效的数据在高可靠性产品经常出现,试验结束时所有样品均无失效。例如航天器等产品。此时,可以使用一些专有算法进行可靠性评估。
3、删失数据案例及分析
开展可靠性数据分析或者威布尔分析工作时,对于包含删失数据的数据处理工作较为复杂,一般可以借助相应的工具(PosWeibull等)进行。对于包含删失数据的可靠性分析,一般可以选择使用最小二乘法(RRX、RRY)、极大似然法进行。需要注意的是,当删失数据较多时,建议选择极大似然法进行分析。
案例1:刹车部件故障数据的寿命分析(完全数据)
试验过程中,监测13个样本的试验情况,并记录13个样本的故障时间数据。然后录入到工具中计算。
图7 数据录入

图8 参数估计及寿命分析
案例2:汽车部件故障数据(右删失和区间删失数据混合)
现在对新旧两个系列的汽车部件失效数据进行可靠性分析。并估计未来50000公里的返修比例。新旧两个系列的产品每隔10000公里进行一次失效检测。新旧两类产品分别检测了90000公里,每隔10000公里进行检测。
其中旧产品第一次检测是不知道具体开始时间的(左删失),90000公里后还有83个样品是未失效的(即右删失),有965个样品是区间删失的,即只知道开始和结束检测时间,但是不知道具体失效时间。
新产品第一次检测是不知道具体开始时间的(左删失),且所有被检测产品均没有发生失效,90000公里后还有210个样品是未失效的(即右删失),有829个样品是区间删失的,即只知道开始和结束检测时间,但是不知道具体失效时间。
对于这种即存在左删失、右删失,又存在区间删失的多种删失数据、任意删失、大批量删失数据的可靠性分析,首先按照开始检测时间、结束检测时间、故障数量/频数、产品类型(新/旧)对检测数据进行梳理、整理。
将整理的数据录入到PosWeibull软件中,使用寿命分析工具进行分析。
图9数据录入

图10 参数估计及寿命分析(综合)

图11 参数估计及寿命分析(分设备类别)
案例3:质保数据分析(右删失与区间删失数据混淆带来的问题)
已知某设备的每月销售数据,以及各月份返修数据。每月销售量为1000台,各月份返修的数据如下图所示。数据按Nevada表格式录入。按照正常情况,我们是每个月都监测、汇报各月份的返修设备数量。所以,应该理解为检测间隔为1个月。所以这些数据应该使用区间删失数据处理方法处理,而大量未出现返修的设备数据作为右删失数据处理。把这些数据按照Nevada表格式录入到PosWeibull工具中,然后计算得到的估计参数为β=1.26,η=399.26。
如果我们错误地把这些返修的设备数据都当成右删失数据(不考虑每个月进行检测问题),计算出来的结果是β=20.60,η=12.06。
由此可见,所计算得到的结果与前面的计算结果相差非常大。所以,在开展可靠性数据分析工作、威布尔分析(weibull)时一定要分析各个数据属于什么类型数据,否则将会出现错误。
图12 设备返修数据录入(正确方法)

图13设备返修数据录入(返修数据当成右删失-错误方法)

图14 正确计算结果

图15 错误计算结果