具体来说,是指相邻两次故障之间的平均工作时间,也称为平均故障间隔。它仅适用于可维修产品。同时也规定产品在总的使用阶段累计工作时间与故障次数的比值为MTBF。磁盘阵列产品一般MTBF不能低于50000小时。MTBF值是产品设计时要考虑的重要参数,可靠性工程师或设计师经常使用各种不同的方法与标准来估计产品的MTBF值。
1、MTBF的计算方法
失效时间是指上一次设备恢复正常状态起,到设备此次失效那一刻之间间隔的时间。
MTBF值是产品设计时要考虑的重要参数,可靠性工程师或设计师经常使用各种不同的方法与标准来估计产品的MTBF值。相关标准包括MIL-HDBK-217F、Telcordia SR332、Siemens Norm、Fides或UTE C 80-810(RDF2000)等。不过这些方法估计到的值和实际的平均故障间隔仍有相当的差距。计算平均故障间隔的目的是为了找出设计中的薄弱环节。
2、MTBF 是平均故障间隔时间
随着服务器的广泛应用,对服务器的可靠性提出了更高的要求。所谓“可靠性”,就是产品在规定条件下和规定时间内完成规定功能的能力;反之,产品或其一部分不能或将不能完成规定的功能是出故障。概括地说,产品故障少的就是可靠性高,产品的故障总数与寿命单位总数之比叫“故障率”(Failure rate),常用λ表示。例如正在运行中的100只硬盘,一年之内出了2次故障,则每个硬盘的故障率为0.02次/年。
当产品的寿命服从指数分布时,其故障率的倒数就叫做平均故障间隔时间,简称MTBF。即:MTBF=1/λ 。
标准故障率的曲线可以用众所周知的“浴盆曲线”来描述。所有元件和系统的曲线形状都近似相同-只是时间轴方向上的延伸率不同。它可以分 为三个区域:早期故障期(I),有效工作期(II),生命终期(III)。MTTF包含了区域I和 II,而MTBF只包含了区域(II)。
第I部分描述了早期故障,它通常是由潜在的材料失效或者是在发货前的终产品检测中没被发现的制造缺陷所造成的。早期故障通常持续的时间较短,即使是很复杂的系统在使用了200 小时后也很少再出现早期故障。例如DC-DC转换器来说,大多数早期故障会在使用24小时之内 发生。24小时对保质期为三年的转换器来说可能很短,但是试想一个DC-DC转换器的工作频率为100Hz,开关三极管和变压器在使用的天就会被操作1亿4千万次以上,因而如果有元件 缺陷的话这段时间内就应该会发生故障。
因为热应力也是增加失效率的原因之一,从早期故障到有效工作之间的过渡时间(T1)可以 通过在热箱中的预烧处理得到显著的缩短。如果产品在高温条件下工作, 那么4小时的预烧时间测试就足以发现的早期故障。如果在终应用中还是出现了早期故障,那么可以增加预烧时间。对于高可靠性的应用装置例如铁轨,预烧时间多为24小 时。
在有效工作寿命阶段,区域II,故障率持续稳定在较低的等级。第二个过渡时间(T2),从 有效果工作寿命阶段到产品的生命终期,受到许多因素的影响,比如设计以及所使用的元件 的雷竞技百科 ,制造时的组装雷竞技百科 以及应用的环境压力。区域III表明了产品寿命周期的末期,其间 由于磨损,材料的化学降解和突发故障导致产品性能下降。
大多制造商使用预烧处理来发现主要的早期故障,MTBF特性通常可以在规格书中找到。
一些制造商更倾向于使用MTBF失效率的倒数,基于109小时,称为失效时间(Failures In Time/FIT):
近看到一款可用于服务器的硬盘,MTBF高达120万小时,保修5年。120万小时约为137年,并不是说该种硬盘每只均能工作137年不出故障。由MTBF=1/λ可知λ=1/MTBF=1/137年,即该硬盘的平均年故障率约为0.7%,一年内,平均1000只硬盘有7只会出故障。
3、MTBF的计算
通常,我们在产品的手册或包装上能够看到如产品MTBF值,如8000小时,2万小时,那么,MTBF的数值是怎样算出来的呢,假设一台电脑的MTBF为3万小时,是不是把这台电脑连续运行3万小时检测出来的呢?答案是否定的,如果是那样的话,我们有那么多产品要用几十年都检测不完的。其实,关于MTBF值的计算方法,目前通用的权威性标准是MIL-HDBK-217、GJB/Z299B和Bellcore,分别用于军工产品和民用产品。其中,MIL-HDBK-217是由美国部可靠性中心及Rome实验室提出并成为行业标准,专门用于军工产品MTBF值计算,GJB/Z299B是我国标准;而Bellcore是由AT&TBell实验室提出并成为商用电子产品MTBF值计算的行业标准。
MTBF计算中主要考虑的是产品中每个器件的失效率。但由于器件在不同的环境、不同的使用条件下其失效率会有很大的区别,例如,同一产品在不同的环境下,如在实验室和海洋平台上,其可靠性值肯定是不同的;又如一个额定电压为16V的电容在实际电压为25V和5V下的失效率肯定是不同的。所以,在计算可靠性指标时,必须考虑上述多种因素。
简单介绍MTBF的一种计算方式
(1)先求出各元器件的工作故障率λp:
λp=λb*πQ*πS*πT
其中λb:元器件基本故障率,元器件失效率表中查得
πQ:为器件的品质系数,由物料认证工程师确认
πS:为电压或电流应力系数
πT:为器件的温度系数
(2)λ求出系统的工作故障率λs
λs=πE*SUM(Aλp1,Bλp2,...NλPI)
其中λpi:第i种元器件的工作故障率
πE:环境系数,根据系统应用环境选择环境系数
Ni:第i种元器件的数量
N:产品中元器件的种类
(3)MTBFλ第三步,求出产品的MTBF=1/λs
其实MTBF针对可靠度只是衡量指标,这些计算实际上都还是步,更重要的是后面的步骤:根据这些衡量指标的计算过程,发现影响产品可靠性的关键部件、环节等等,改进产品的设计、生产,终的目的是提高产品的可靠性。
4、MTBF分析的目的
(1)针对高频率故障零件的重点对策及零件寿命延长的技术改造依据。
(2)进行零件寿命周期的推算及维修计划编制。
(3)有关点检对象、项目的选择与点检基准的设定、改善。
(4)用于指导内外部维修工作分配。根据公司内设备修复能力的评价,以设备类型、作业种类的不同来决定内部分别承担工作的维修雷竞技百科 与设备效率方面的风险,作为维修外包的重要参考。
(5)设定备品备件基准。机械、电气零件的各储备项目及基本库存数量,应根据MTBF的记录分析来判断,使其库存水平达到经济的状况。
(6)作为选择维修技术方法改善重点的参考依据。为了提高设备开动率,必须缩短与设备停机相关的长时间维修作业及工程调整、切换的时间。因此,有必要对维护作业方法进行检验,而其检验的项目、优先顺序的选择等基本情况,均需要依据MTBF的分析记录表。
(7)用于设备对象设定预估运行时间标准,及其维护作业的选定与维护时间标准的研究。维修计划预估时间标准的设定及维护作业的选定,必须考虑设备维护重复周期或标准时间值与实际维护时间的差异及相应维护作业特性等因素,因此,MTBF 分析表是非常必要的。
(8)图样整理及重新选定重点设备或零件时的参考。MTBF的分析记录表所记录的设备零件改造项目或摩擦劣化等信息,以及设备图样修改或前期制作等情况,通过能经常作分析检验及重要性排序管理,可以使工程图样管理变得更容易。
(9)运行操作标准的设定、修订及决定设备维护业务的责任分派。
(10)提供设备的可靠性、维修性设计的技术资料。维护技术重要的是以MTBF分析表为基础,收集有关设备的可靠性、可维修性设计的技术信息,以便提供给设计部门在设计设备时参考。