可靠性试验
第四部分 可靠性试验
编讲 杨志飞
第一章 可靠性试验概述
1 电子产品可靠性试验的目的
可靠性试验是对产品进行可靠性调查、分析和评价的一种手段。试验结果为故障分析、研究采取的纠正措施、判断产品是否达到指标要求提供依据。具体目的有:
(1) 发现产品的设计、元器件、零部件、原材料和工艺等方面的各种缺陷;
(2) 为改善产品的完好性、提高任务成功性、减少维修人力费用和保障费用提供信息; (3) 确认是否符合可靠性定量要求。
为实现上述目的,根据情况可进行实验室试验或现场试验。
实验室试验是通过一定方式的模拟试验,试验剖面要尽量符合使用的环境剖面,但不受场地的制约,可在产品研制、开发、生产、使用的各个阶段进行。具有环境应力的典型性、数据测量的准确性、记录的完整性等特点。通过试验可以不断地加深对产品可靠性的认识,并可为改进产品可靠性提供依据和验证。
现场试验是产品在使用现场的试验,试验剖面真实但不受控,因而不具有典型性。因此,必须记录分析现场的环境条件、测量、故障、维修等因素的影响,即便如此,要从现场试验中获得及时的可靠性评价信息仍然困难,除非用若干台设备置于现场使用直至用坏,忠实记录故障信息后才有可能确切地评价其可靠性。当系统规模庞大、在实验室难以进行试验时,则样机及小批产品的现场可靠性试验有重要意义。
2 可靠性试验的分类
2.1 电子装备寿命期的失效分布
目前我们认为电子装备寿命期的典型失效分布符合“浴盆曲线”,可以划分为三段:早期失效段、恒定(随机或偶然)失效段、耗损失效段。可参阅图1.2.1。
早期失效段,也称早期故障阶段。早期失效出现在产品寿命的较早时期,产品装配完成即进入早期失效期,其特点是故障率较高,且随工作时间的增加迅速下降。早期故障主要是由于制造工艺缺陷和设计缺陷暴露产生,例如原材料缺陷引起绝缘不良,焊接缺陷引起虚焊,装配和调整不当引起参数漂移,元器件缺陷引起性能失效等。早期失效可通过加强原材料和元器件的检验、工艺检验、不同级别的环境应力筛选等严格的质量管理措施加以暴露和排除。
失效率
恒定失效段,也称偶然失效段,其故障由装备内部元器件、零部件的早期 耗损随机性失效引起,其特点是故障率失效 偶然失效段 低,比较稳定,因此是装备主要工作
时段。 耗损失效段,其特点是故障率迅
速上升,导致维修费用剧增,因而报图1.2.1 电子装备寿命期失效分布的浴盆曲线示意
废。其故障原因主要是结构件、元器
件的磨损、疲劳、老化、损耗等引起。 2.2 试验类型及其分布曲线的变化
针对电子装备寿命期失效分布的三个阶段,人们在设计制造和使用装备时便有针对地采取措施,以提高可靠性和降低寿命周期的费用。在设计制造阶段,要尽量减少设计缺陷和制造缺陷,即便如此仍然会存在早期失效和随机失效。为此,承制方需要运用工程试验的手段来暴露和消除
早期失效,降低随机失效的固有水平。通过这些措施,可以改变产品的寿命分布曲线的形状,可参阅图1.2.2。在耗损阶段,用户可通过维修和局部更新的手段延长装备的使用寿命。
图 1.2.2 示意了两组产品寿命失效率分布曲线,图中表明产品B的可靠性水平比产品A的优良,因为B的恒定失效率比A的低,B的早期失效段比A的短。如果曲线A和B是同一种产品的不同阶段的失效率分布,则表明该产品经过了可靠性增长试验,取得成效,因此曲线B的恒定失效率大为降低。曲线B的早期失效段示意了B和B’两条,它们表明B比B’的早期失效率为低,显示其工艺和元器件、原材料的缺陷比B’的少,环境应力筛选所需的资源也可较少。
2.3 装备可靠性试验分类 2.3.1 装备可靠性试验项目分类 由装备可靠性试验的目的出发,我们把它分为可靠性工程试验和可靠性验证试验两大类,每类试验又包括几种试验项目。 (1) 可靠性工程试验,其目的在于暴露产品故障以便人们消除它,由承制方进行,试验样品从研 制样机中取得。可靠性工程试验包 图1.2.2 装备可靠性试验结果对失效分布曲线形状影响 括环境应力筛选和可靠性增长试验。从试验性质来分析,现行的老炼也属于工程试验项目;由环境应力筛选发展起来的可靠性保证试验也可归纳于此。工程试验的出发点是:尽量彻底地暴露产品的问题、缺陷,并采取措施纠正,再验证问题得到解决、缺陷得到消除与否。经过工程试验的产品,其可靠性自然会提高,满足用户要求的可能性也必然增大。可见,可靠性工程试验是产品的可靠性基础工作,是产品研制生产的工艺过程。
(2) 可靠性验证试验,从试验原理来说,要应用统计抽样理论,因此又称统计试验。其目的是为了验证产品是否符合规定的可靠性要求,由承制方根据有关标准和研制生产进度制订方案和计划,经定购方认可;重点型号装备的验证试验方案还需报上级领导机关批准,由有关各方组织联合试验小组。验证试验包括产品研制的可靠性鉴定试验和批量生产的可靠性验收试验。这类试验必须能够反映装备的可靠性定量水平,因此试验条件要尽量接近使用的环境应力;试验结果要作出接收或拒收的判断,因此对试验时间和发生的故障应作详细记录,经过与失效判据的对比分析后,试验各方统一认识后才能作出最后的结论。 2.3.2 装备可靠性试验项目的区别
产品研制生产过程除进行可靠性试验之外,一般还要进行环境(鉴定)试验,各种试验的目的不同,不能相互取代,它们的区别可参阅表1-2-1。
3 试验安排
在安排试验计划时,应将可靠性试验与性能试验、环境应力和耐久性试验尽可能地结合起来,构成比较全面的可靠性综合试验计划。这样可避免重复试验,保证不漏掉在单独试验中易疏忽的问题和缺陷,可提高效率节省费用。
(1) 产品的性能试验应在样机制造出来后即进行,试验暴露的缺陷应成为改进措施的直接依据。评定产品性能和可靠性是否满足用户要求,必须在标准环境条件下使用规定容限值进行性能测量,以获得重现结果和所需的精度。
要分别测量记录试验前(标准条件)、试验中(试验条件)、试验后(标准条件)的性能,以便进行比较。
(2) 环境应力的种类要按照实际情况进行综合。环境应力至少应包括热、振动、潮湿等应力;温度循环中的湿度等级应足以产生明显的冷凝和霜冻;振动应力应考虑振动类型、频率范围、应力大小和使用方法及振动方位等因素。这一切应能类似于现场使用环境和任务剖面所产生的情况。
(3) 耐久性试验一般包括环境试验、过负荷试验、模拟或接近环境剖面的循环试验。试验中发生的问题都要作出分析并采取纠正措施。然后对改进后的产品再作试验,以证明问题是否已经解决。
4 试验评估
4.1 试验条件的评估
试验条件和步骤、方法都要尽可能模拟产品的寿命剖面和任务剖面,使试验具有真实性。试验的目的是暴露在使用环境下才能发生的问题、故障和缺陷。如果试验只能暴露一部分问题,这是在浪费时间和资源。试验模拟的程度,取决于试验目的。
(1) 试验真实性不高的原因可能是忽视了某些应力。如接插件作静态寿命试验时忽略了振动应力,致使现场使用时故障频繁。
(2) 暴露缺陷的试验,施加的应力高于使用应力也是合适的。“过应力”试验一般用于工程可靠性试验,如老炼试验、筛选、研制阶段的可靠性增长试验等。这些属于加速试验特性,可尽早暴露产品潜藏的薄弱环节,采取措施纠正之。
(3) 模拟寿命剖面的试验,希望试验得到的可靠性与使用中的可靠性相一致。然而模拟的条件与使用的真实条件总是有差异的。在多数情况下,用恒定应力条件作寿命试验,效果不好。因此要设计综合应力的循环周期的试验剖面,使之比较接近使用条件。 4.2 装备可靠性评估
测定产品可靠性定量指标,提供各种信息,作出产品的可靠性评估,是管理工作所要求的。可靠性指标的点估计值和置信区间估计,是产、购双方对产品寿命期费用决策的重要信息。可靠性指标的点估计值和置信区间估计的依据是试验数据。试验数据的具体处理方法在有关标准中规定。只凭试验结果就对装备的可靠性水平进行评估,信息量可能不够,往往要结合制造和使用的其它信息进行综合评价,才能使用户放心。
5 试验管理
从研制生产到交付部队使用,要进行多项与可靠性有关的试验。为了确保达到用户提出的
要求,遵守交付周期,节省资源,加强管理是十分必要的。试验管理的目的是为了提高试验成效、确保产品可靠性大纲的效果,管理的任务主要是制订和落实试验计划,因此要多安排综合试验,常用的方法是组织、协调、督促。试验管理工作要围绕研制生产的产品确定试验项目、明确在何时进行、由何部门组织哪些人参加和实施、采用何种试验手段、试验方案和计划由谁制订和批准,试验情况的记录和处置,试验结果的处理等。 综合的可靠性试验计划一般包括以下内容: (1) 确定装备的可靠性要求;
(2) 规定可靠性试验的应力条件; (3) 规定试验进度计划;
(4) 详细的可靠性试验方案; (5) 试验操作程序;
(6) 受试产品的说明和性能监测要求; (7) 试验设备和监测仪器;
(8) 试验记录和试验数据的处理方法; (9) 试验报告的内容。
试验管理除了计划管理之外,还包括试验费用的管理,为保证研制工作进度和避免追加费用,试验工作的重点应放在工程试验上。综合了较多试验内容的计划,还应包括每项试验的方案、决策风险、试验条件、试验程序、在寿命周期的计划等。
第二章 环境应力筛选
1 环境应力筛选的目的和原理
1.1 环境应力筛选的目的
环境应力筛选的目的在于发现和排除产品的早期失效,使其在出厂时便进入随机失效阶段,以固有的可靠性水平交付用户使用。 1.2 环境应力筛选的原理
环境应力筛选是通过向电子装备施加合理的环境应力和电应力,将其内部的潜在缺陷加速变成故障,以便人们发现并排除。
环境应力筛选是装备研制生产的一种工艺手段,筛选效果取决于施加的环境应力、电应力水平和检测仪表的能力。施加应力的大小决定了能否将潜在的缺陷在预定时间内加速变为故障;检测能力的大小决定了能否将已被应力加速变成故障的潜在缺陷找出来,以便加以排除。因此,环境应力筛选又可看作是产品质量控制检查和测试过程的延伸。
2 缺陷分类
2.1 通用定义
产品丧失规定的功能称失效。对可修复产品通常也称为故障。对设备而言,任一质量特征不符合规定的技术标准即构成缺陷。
绝大多数电子装备的失效都称为故障,以故障原因对其进行分解可以参阅图2.1.1。从图中可知,装备故障分为偶然失效型故障和缺陷型故障两大类。人们认为偶然故障表现为随机失效,是由元器件、零部件固有失效率引起的;而缺陷型故障由原材料缺陷、元器件缺陷、装配工艺缺陷、设计缺陷引起,元器件缺陷本身又由结构、工艺、材料等缺陷造成,设计缺陷则包含电路设计缺陷、结构设计缺陷、工艺设计缺陷等内容。
结构 工艺 材料 电路设计 结构设计 工艺设计 元器件缺陷 设计缺陷
原材料装配工艺 缺陷缺陷
缺陷型故障 偶然失效型故障
电子装备故障
图2.1.1 电子装备故障原因分解示意 2.2 电子设备可视缺陷分类
按照GJB 2082《电子设备可视缺陷和机械缺陷分类》,从影响与后果方面缺陷分为致命缺陷、重缺陷、轻缺陷;从可视的角度来看,产生缺陷的主要工艺类型有:焊接、无焊连接、电线
与电缆、多余物、防短路间隙、接点、印制电路板、零件制造安装、元器件、缠绕、标记等,其中多数都可能产生致命缺陷或重缺陷,轻缺陷比较普遍。
致命缺陷是指对设备的使用、维修、运输、保管等人员会造成危害或不安全的缺陷,或可能妨碍某些重要装备(如舰艇、坦克、大型火炮、飞机、导弹等)的战术性能的缺陷。
重缺陷是指有可能造成故障或严重降低设备使用性能,但又不构成致命缺陷的缺陷。
轻缺陷是指不构成重缺陷,但会降低设备使用性能或不符合规定的技术标准,而对设备的使用或操作影响不大的缺陷。
可视缺陷是指通过人的视觉器官可直接观察到的,或采用简单工具对设备质量特征所能判定的缺陷。
承制单位的质量检验人员对大多数可视缺陷都可以发现并交有关部门排除,唯有不可视缺陷需要进行环境应力筛选或其它方法才能被发现,否则影响产品可靠性。
3 筛选应力及其效应表达式
3.1 常规筛选与定量筛选
常规筛选是指不要求筛选结果与产品可靠性目标和成本阈值建立定量关系的筛选。筛选方法是凭经验确定的,筛选中不估计产品引入的缺陷数量,也不知道所用应力强度和检测效率的定量值,对筛选效果好坏和费用是否合理不作定量分析,仅以能筛选出早期失效为目标。筛选后的产品不一定到达其故障率恒定的阶段。
定量筛选是要求筛选的结果与产品的可靠性目标和成本阈值建立定量关系的筛选。定量筛选有关的主要变量是引入缺陷密度、筛选检出度、析出量或残留缺陷密度。引入缺陷密度取决于制造过程中从元器件和制造工艺两个方面引进到产品中的潜在缺陷数量;筛选检出度取决于筛选的应力把引入的潜在缺陷加速发展成为故障的能力和所用的检测仪表把这些故障检出的能力;残留缺陷密度和缺陷析出量则取决于引入缺陷密度和筛选检出度。定量环境应力筛选关系式如下: DR=DIN—F
=DIN(1—TS) (2-3-1) TS=SS×DE (2-3-2) 式中:DR——残留缺陷密度,平均个/产品;
DIN ——装备引入的缺陷密度,平均个/产品; F——境应力筛选析出的缺陷量,平均个/产品; TS——筛选检出度; SS——筛选度; DE——检测效率。
在进行定量筛选之前,首先要按照可靠性要求确定残留缺陷密度的目标值DRG,然后通过适当地选择筛选应力种类及其量值的大小、检测方法、筛选所在等级等参数设计筛选大纲。实施此大纲时,要进行监测和评估,确定DIN、SS、DR的观察值,并与设计估计值比较,以便及时采取措施保证实现定量筛选目标,并使之最经济有效。定量环境应力筛选的控制过程请参阅图2.3.2。 3.2 恒定高温应力 3.2.1 参数的计算 3.2.1.1 筛选度计算
设恒定高温筛选的应力参数是温度Tu 、筛选时间t、环境温度TE (一般取25℃),其筛选度SS的表达式为:
SS=1-exp[-0.0017(R+0.6)0.6 t] (2-3-3) 式中:R=Tu-TE =Tu-25 ——温度变化范围,℃; t——恒定高温的持续时间,h。
按公式(2-3-1)计算的恒定高温筛选度数据见表2-3-1。
缺陷 缺陷
图 2.3.2 定量环境应力筛选变量关系示意
3.2.2 筛选故障率计算
恒定高温筛选时缺陷的故障率表达式如下:
λD =[-ln(1-SS)]/t (2-3-4)
式中:λD ——故障率,次/小时; SS——筛选度;
根据式(2-3-4)计算的恒定高温故障率(λD )见表2-3-1
表2-3-1 恒定高温筛选度(SS)和故障率(λ
)
3.2.3 恒定高温应力激发的故障模式或影响
恒定高温能激发的故障模式(或对产品的影响)主要有:
使未加防护的金属表面氧化,导致接触不良或机械卡死,在螺钉连接操作时用力不当或保护涂层上有小孔和裂纹都会出现这种未防护的表面。
加速金属之间的扩散,如基体金属与外包金属,钎焊焊料与元件,以及隔离层薄弱的半导体与喷镀金属之间的扩散;
使液体干涸,如电解电容和电池因高温造成泄漏而干涸;
使热塑料软化,如该热塑料件处于太高的机械力作用下,则产生蠕变; 使某些保护性化合物与灌封蜡软化或蠕变;
提高化学反应速度,加速与内部污染物的反应过程; 使部分绝缘损坏处绝缘击穿。 3.3 温度循环应力
3.3.1 温度循环应力参数
温度循环应力参数有:上限温度、下限温度、循环次数、温度变化速率。 3.3.2 温度循环应力筛选度计算
0.63
SS=1-exp-0.0017(R+0.6) [Ln(e+v)] .N (2-3-5) 式中:R=Tu-TL ,——温度变化范围,℃; Tu ——上限温度,℃; TL ——下限温度,℃;
V ——温度变化速率,℃/min; N ——循环次数;
e =2.71828,——自然对数的底。
按式(2-3-5)计算的温度循环应力筛选度见表2-3-2。
3.3.3 温度循环应力故障率计算
λD = [-Ln (1-SS)] / N (2-3-6) 式中:λD ——故障率,平均次/循环; SS ——筛选度; N ——循环次数。
各参数组对应的故障率见表2-3-3。
3.3.4 温度循环应力激发的故障模式或影响
使涂层、材料或线头上各种微细裂纹扩大;使粘接不好的接头松驰;使螺钉连接或铆接不当的接头松驰;使机械张力不足的压配接头松驰;使质量差的焊点接触电阻加大或开路;粒子污染;密封失效。
表2-3-3 温度循环故障率(λ
)
3.4 扫频正弦振动应力
3.4.1 扫频正弦振动应力的筛选度计算
SS =1-exp[-0.000727(G)0.863 ·t] (2-3-7) 式中:G—高于交越频率的加速度量值,g; t—振动时间,min。
按式(2-3-7)计算的结果见表2-3-4。 3.4.2 扫频正弦振动应力的故障率
λD = [-Ln (1-SS ) ] / t (2-3-8) 式中:λD —故障率,次/h; SS—筛选度; t—时间,h。
按式(2-3-8)计算的结果也见表2-3-4。
3.4.3 扫频正弦振动应力激发的故障模式或影响
使结构部件、引线或元器件接头产生疲劳,特别是导线上有微裂纹或类似缺陷的情况下; 使电缆磨损,如在松驰的电缆结处存在尖缘似的缺陷时; 使制造不当的螺钉接头松驰; 使安装加工不当的IC离开插座;
使受到高压力的汇流条与电路板的钎焊接头的薄弱点故障;
使未充分消除应力的可作相对运动的桥形连接的元器件引线造成损坏,例如电路板前板的发光二极管或背板散热板上的功率晶体管;
已受损或安装不当的脆性绝缘材料出现裂纹。 3.5 随机振动应力
3.5.1 随机振动应力的参数 随机振动应力的参数有:
频率范围、加速度功率谱密度(PSD)、振动时间、振动轴向数。 其振动谱可参阅图2.3.3。 3.5.2 随机振动应力筛选度
随机振动应力筛选度的计算式如下:
1.71
SS=1-exp[-0.0046(Grms ) t] (2-3-9) 式中:Grms—加速度均方根值,g;
1/2
Grms =(A1 +A2 +A3 ) ; (2-3-10) A1 、A2 、A3 ——随机振动谱的面积,g2 (见图2.3.3); t—动时间,min。
加速度功率谱 0.4
3.5.3 随机振动应力故障率计算 2
g/Hz 随机振动应力的故障率计算式
如下:
λD = [-Ln (1-SS)] / t
(2-3-11)
2 3
式中:λD —故障率,平均次/h;
HZ
SS—筛选度; 0 20 80 350 2000
t—时间,h。 图2.3.3 随机振动谱示意
按照式(2-3-9)计算的筛选度和按照
式(2-3-11)计算的故障率数值见表
2-3-5。
3.5.4 随机振动应力激发的故障模式或影响
随机振动应力激发的故障模式或影响与正弦扫频振动应力相同,但故障机理更复杂,发展故障的速度要比扫频正弦振动应力快得多,这是由于随机振动能同时激励许多共振点的作用结果。 3.6 筛选效果对比 3.6.1 温度应力对比
a) 对恒定高温应力的分析
恒定高温筛选的筛选度与温度增量、筛选时间密切相关,但其量值很小,由表2-3-1查得当温度增量为最大(80℃)、老炼筛选时间最长(200h)时,筛选度为0.9912。恒定高温的故障率只与温度增量有关,其值也很小,同样从表2-3-1查得温度增量最大(80℃)时故障率为平均0.0237次/h。即为了暴露1个缺陷,用温度增量为80℃的恒定高温进行筛选平均需要42个小时。如果按有些产品以45℃(温度增量为20℃)高温进行老炼筛选的话,其故障率为0.0104次/h,需要平均老炼100小时才能暴露1个缺陷。因此可见,为了达到消除早期失效的目的,用恒定高温的老炼筛选时间要很长,不仅筛选效率低下,而且有可能要影响产品的使用寿命。
故障率低和可能影响产品的使用寿命是恒定高温筛选应力的致命缺点。 b) 对温度循环应力的分析
温度循环应力的筛选度与温度范围、循环次数有关,并且与温度变化速率关系最密切,即温度升降速率越大,其筛选度也越大。由表2-3-2可查得温度范围为180℃、循环次数为4、温度变化速率为20℃/min时,筛选度为0.9907。归一化后其故障率与温度变化范围和温度变化速率成正相关。由表2-3-3可查得,当温度变化范围为80℃、温度变化速率为5℃/min时温度循环应力的故障率平均为0.2020次/循环,一般每个循环时间在3.5~4.0小时之间,因此该应力的故障率相当于平均0.0505次/h~0.0577次/h之间。
因此,故障率高、筛选效率高、不会影响产品使用寿命是温度循环应力的特点。 c) 温度应力的比较
由上分析可知,温度变化范围为80℃、温度变化速率为5℃/min的温度循环应力的故障率是温度增量为80℃的恒定高温应力的2倍多(0.0505与0.0237之比)。而且在工程上要实现前者比后者容易得多。温度增量为80℃的恒定高温应力要让产品经受105℃(80+25)高温的相当长时间的工作过程,平均42小时才能暴露1个故障。而温度循环应力,通常采用温度交变试验箱,此类设备对温度范围为80℃(由-35℃变化到+45℃)、温变速率为5℃/min的性能参数是最低的要求,轻易便可实现,此应力可使产品平均筛选20小时便可以暴露1个故障,比恒定高温应力的筛选效率高很多。
为了进一步提高温度循环应力的筛选效率,可以通过提高温度变化率的应力参数来实现。由表2-3-2可知,当温度范围仍为80℃、温度变化速率由5℃/min提高到20℃/min时,其故障率由平均0.2020次/循环提高到平均0.7212次/循环,后者是前者的3.5倍多,即平均5个小时便可以暴露1个缺陷。
当然,温度交变试验箱要实现20℃/min的温变速率,需要大幅度地增加升降温系统的功率,甚至要在机械致冷的基础上加装液态氮致冷系统及其控制装置。这需要增加投入。为了提高筛选效率、减少筛选对产品寿命的影响,提高温变速率是最好的方法,为此而增加投入也是适宜的。 3.6.2 振动应力对比
一般说来,振动应力是定量环境应力筛选方法才采用的应力,它可以暴露温度循环暴露不了的某些缺陷。据统计,对电子设备而言,温度应力平均可以暴露79%的缺陷,而振动应力平均可以暴露21%的缺陷。因此,振动是不可缺少的筛选应力。扫频正弦振动台和随机振动台都可以作为振动环境应力筛选的设备,但由表2-3-4和表2-3-5的数据可以比较它们的故障率(即筛选效率)。
我们按照GJB 1032《电子产品环境应力筛选》标准要求的典型的随机振动谱(见图2.3.3)算得其加速度均方根值为7.2g,取为7g;设持续时间为5min,查表2-3-5得筛选度为0.478、故障率为7.692次/小时。同样设扫频正弦振动的加速度为7g、持续时间为5min,查表2-3-4可得筛选度为0.0193、故障率为0.2339次/小时。两种振动应力的故障率相差甚大,随机振动是扫频振动的33倍!几种应力的筛选度和故障率的对比见表2-3-6。
要比扫频振动台昂贵,但是为了提高筛选效率,最大限度地消除早期故障,这个投入还是合算的。
3.6.3 结论
a) 经典的老炼工艺与常规的恒温筛选对暴露产品的缺陷有一定的作用,但其筛选度和故障率数值很小,效率十分低,需要用相当长的时间才能达到消除早期失效(缺陷)的效果,因而可能会影响产品的使用寿命,有必要改用定量环境应力筛选方法。
b) 如果采用常温考机的办法作为产品出厂的依据,在几百小时内暴露不了一个缺陷,也说明不了产品的可靠性有什么样的水平,此法意义不大。
c) 定量环境应力筛选,需要采用温度循环应力,其效率已比恒定高温老炼筛选大为提高;就温度循环筛选而言,提高温变速率又是进一步提高筛选效率、减少筛选对产品使用寿命影响的最佳方法,我们要为此项筛选创造条件。
d) 定量环境应力筛选,需要采用振动应力,其中又可以采用扫频正弦振动或随机振动方式,但从筛选效率对比可知,随机振动方式是最佳的应力。为了提高筛选效率、减少振动应力筛选对产品结构件寿命的影响,应创造条件采用随机振动方式。
4. 环境应力筛选方案设计
4.1 设计原则
环境应力筛选试验方案的设计原则是:使筛选应力能激发出由于潜在设计缺陷、制造缺陷、元器件缺陷引起的故障;所施加的应力不必模拟产品规定的寿命剖面、任务剖面、环境剖面;在试验中,应模拟设计规定的各种工作模式。
根据条件和是否必要来确定常规筛选或是定量筛选;根据不同阶段和产品的特征制订筛选方案。
4.1.1 研制阶段的筛选
研制阶段一般按照经验得到的筛选方法进行常规筛选.,其主要作用是:一方面用于收集产品中可能存在的缺陷类型、数量及筛选方法效果等信息;另一方面,在可靠性增长和工程研制试验前进行了常规试验,可节省试验时间和资金;同时利于设计成熟快捷的研制试验方法。
研制阶段的常规筛选要为生产阶段的定量筛选收集数据,为定量筛选作准备,设计定量筛选的大纲。
4.1.2 生产阶段的筛选
生产阶段的筛选主要是实施研制阶段设计的定量筛选大纲;并通过记录缺陷析出量和设计估计值的比较,提出调整筛选和制造工艺的措施;参考结构和成熟度相似产品的定量筛选经验数据,完善或重新制订定量筛选大纲。这些经验数据主要有:
故障率高的元器件和组件型号;故障率高的产品供货方;元器件接收检验、测试和筛选的数据;以往筛选和测试的记录;可靠性增长试验记录;其它试验记录。
4.2 设计依据
4.2.1 依据产品缺陷确定筛选应力 4.2..1.1 影响产品缺陷数量的因素
如前所述,产品在设计和制造过程引入的缺陷主要是:设计缺陷、工艺缺陷、元器件缺陷。这些缺陷可归纳为两种类型,一是固有缺陷,它是存在于产品内部的缺陷,如材料缺陷、外购元器(部)件缺陷和设计缺陷;二是诱发缺陷,它是人们在生产或修理过程中引入的缺陷,如虚焊、连接不良等。这些缺陷的可视缺陷或用常规检测手段便可发现缺陷,可在生产中被排除;除此之外的缺陷便成为潜在缺陷,构成装备的早期故障根源。装备的早期故障一般要经过100小时以内的工作才能暴露,从而被排除。
影响产品缺陷数量的主要因素有:
产品的复杂程度。产品越复杂,包含的元器件类型和数量越多、接头类型和数量越多,则设计和装焊的难度越大,设计制造中引入缺陷的可能性越大。同时也增加环境防护设计的难度。 元器件质量水平。元器件质量水平是装备缺陷的主要来源,元器件质量水平包括质量等级和缺陷率指标两个方面,后者用PPM表示,一般生产厂要在说明书中表示。这是定量筛选方案设计的重要依据。
组装密度。组装密度高,元器件排列拥挤,装焊操作难度大,易碰伤元器件,工作中散热条件差,易引入工艺缺陷和使缺陷加速扩大。
设计和工艺成熟程度。设计和工艺的成熟程度的提高,可以大大地减少产品的设计缺陷和工艺缺陷的种类及其数量。一般,在研制阶段,在结构设计定型之前,设计缺陷占主导地位;在生产阶段,设计缺陷减少,元器件缺陷和工艺缺陷比例增加,并且随着设计的改进和工艺的不断成熟,元器件缺陷将占主导地位。
制造过程控制。制造过程控制主要是质量控制,包括采用先进的工艺质量控制标准和管理制度,管理控制得越严格,引入缺陷的机会就越少。
4.2.1.2 环境应力对缺陷的影响
现场环境应力是影响缺陷发展成故障的主要因素。任何缺陷发展成为故障都需要受到一定强度应力经过一定时间的作用,产品只有受到能产生等于或大于阈值的环境应力才能使某些缺陷变为故障;在某些温和的环境应力中,许多缺陷不会发展为故障。因此,只有选择能暴露某些缺陷的应力作为筛选的条件,才能达到筛选的目的。常用的应力所能发现的典型缺陷见表2-4-1。据统计,温度应力可筛选出80%的缺陷,振动应力可筛选出20%左右的缺陷。
4.2.2 根据缺陷分布确定筛选等级
4.2.2.1 缺陷分布
缺陷在装备研制生产的不同阶段的类别和分布是变化的,因此在制定筛选大纲时要根据产品缺陷的分布确定筛选等级。在研制阶段,设计缺陷的比例最大;在生产初期,设计缺陷比例下降,工艺缺陷比例增加,占最大比例;在生产成熟阶段,设计和工艺趋于成熟,个人操作熟练,元器件缺陷比例变得最大,此时设计缺陷一般只占5%以下,工艺缺陷在30%以下,而元器件缺陷可占60%以上。表2-4-2是不同装备在单元或模块组装等级进行环境应力筛选暴露的缺陷比例,反映了缺陷的分布情况,可作参考。
4.2.2.2 筛选组装等级的选择
为了保证基本消除装备的早期故障,最好在各个装配等级上都安排环境应力筛选。任何筛选都不可能代替高一装配等级上的筛选。而任何高一级的筛选虽然可以代替低一级的筛选,但筛选效率会降低,筛选成本要提高。一般装备分成设备或系统级(包括电缆和采购的单元)、单元级
(包括采购的组件和布线)、组件级(包括印制电路板和布线)、元器件等4个级别。据经验介绍,对元器件的筛选成本需要1~5个货币单位的话,组件级筛选则需要30~50货币单位,单元级需要250~500货币单位,设备或系统级需要500~1000货币单位。
根据多数单位的情况来看,设计筛选取组件级及以下和取单元级及以上的较多。
从综合的角度来看,组件级筛选的优点是:每检出一个缺陷的成本低,尺寸小、不通电可进行成批筛选、效率高;组件的热惯性低,可进行更高温度变化率的筛选,筛选效率提高。其缺点是:由于不通电,难以检测性能,筛选寻找故障的效率低;如果改成通电筛选检测,需要专门设计设备,成本高;不能筛选出该组装等级以上的组装引入的缺陷。
单元级以上的筛选优点是:筛选过程易于安排通电监测,检测效率高;通常不用专门设计检测设备;单元中各组件的接口部分也得到筛选,能筛选各组件级引入的潜在缺陷。其缺点是:由于热惯性较大,温度变化速率不能大,温度循环时间需要加长;单元级包含了各种元部件,温度变化范围较小,会降低筛选效率;每检出一个缺陷的成本高。 4.2.3 根据检测效率确定定量筛选目标
检测效率是环境应力筛选工作的重要因素。给产品施加应力把潜在缺陷变成明显的故障后,能否准确定位和消除,就要取决于检测手段及其能力。当选择在较高组装等级进行筛选时,有可能利用较现成的测试系统或机内检测系统;在选择高组装级筛选时,能准确地模拟各种功能接口,也便于规定合理的验收准则,容易实现高效率的检测,提高检测效率。表2-4-3列出了不同组装等级情况的检测效率,表2-4-4列出了各种测试系统的检测效率范围,可用于计算析出量的估计值。需要指出的是,综合利用各种检测系统能提高检测效率。
4.2.4 元器件缺陷率的确定
确定环境应力筛选的定量目标必须确定产品的元器件缺陷率。可以按以下方法确定元器件缺陷率。
4.2.4.1 查表法
国产元器件由GJB 299《电子设备可靠性预计手册》规定质量等级,当产品选定某个等级的元器件后,按照使用环境条件,可以从GJB/Z34《电子产品定量环境应力筛选指南》的附录A的相应表中查得不同质量等级、不同使用环境的各种电子元器件的缺陷率数据(以PPM表示)。进口元器件问题较复杂,我们不可能查得每一个国家每一种元器件的缺陷率,只能参考美国MIL-HDBK-
217E查出质量等级,然后从GJB/Z34中查出进口元器件的缺陷率。 4.2.4.2 试验验证法
当所用的元器件质量等级无法从手册中查得缺陷率数据时,可根据GJB/Z34《电子产品定量环境应力筛选指南》提供的方法对元器件进行抽样筛选,处理试验数据获得该元器件的缺陷率。 4.2.4.3 推算法
当具备足够的失效率、缺陷率、环境系数、质量系数等数据时,可以按照以下步骤推算同类元器件在同种环境中其它质量等级下的缺陷率。
4.2.4.3.1 根据质量系数推算同类元器件在同种环境中其它质量等级下的缺陷率 a) 基本信息
某类元器件的缺陷率DP ,包括在生产厂发现的缺陷率DPF和在现场使用中发现的缺陷率DPU,即DP=DPF+DPU,用PPM表示。
已知缺陷率和质量等级的元器件的质量系数πQ1和未知质量等级的缺陷率元器件的系数πQ2。 b) 计算公式
失效率与质量系数成正比的元器件,其缺陷率为
DPC=(πQ2/ πQ1 )×DPO =(πQ2/ πQ1 )×(Dpfo+Dpuo) (2-4-1) 式中: DPC——要计算的缺陷率,PPM;
DPO——已知质量等级元器件的总缺陷率,PPM;
πQ1——已知质量等级元器件的质量系数,可从有关标准中查得;
πQ2——要计算其缺陷率的质量等级元器件的质量系数,可从有关标准查得; Dpfo——已知质量等级元器件工厂缺陷率,PPM;
Dpuo——已知质量等级元器件现场使用中发现的缺陷率,PPM。 c) 示例
已知:某进口晶体管的质量等级为JAN级,缺陷率为D P(JAN)=346PPM;求取:质量等级为JANTX进口晶体管的缺陷率。
步骤:从有关标准查得: πQ(JΑΝ)=1.2 πQ(JΑΝTX)=2.4
按式(2-4-1)计算
DP(JANTX)=(πQ(JANTX)/ πQ(JAN) )×DP(JAN) =(0.24/1.2)×346 =69.2 (PPM)
4.2.4.3.2 根据环境系数推算同类元器件同一质量等级在其它环境中的缺陷率 其一:失效率与环境系数成正比的元器件 a) 基本信息
某质量等级的元器件在给定环境中的缺陷率DP,包括在生产中发现的缺陷率DPf和现场使用环境中的缺陷率DPU,在生产中发现的缺陷率实际上就是地面固定环境(GF)的缺陷率。 给定环境的相应环境系数πE1。
求取缺陷率所处环境相应的环境系数πE2。 b) 计算公式
DPC=Dpf+(πE2/ πE1 )×Dpu (2-4-2) 式中:DPC——要计算的缺陷率,PPM;
Dpf——已知的在工厂的缺陷率,PPM; Dpu——已知的在使用现场的缺陷率,PPM;
πE1——已知缺陷率所在环境的环境系数,可从有关标准查得; πE2 ——要计算的缺陷率所在环境的环境系数,可从有关标准查得。
c) 示例
已知:进口的质量等级为JAN的晶体管在地面固定环境(GF)中的缺陷率为346PPM,其中工厂缺陷率为60PPM,使用环境缺陷率为286PPM;
求取:该等级晶体管在地面移动环境(GM)中的缺陷率。 步骤:从有关标准查得两种环境的环境系数: πE1=πE(GF)=5.3 πE2=πE(GM)=18 应用公式(2-4-2)计算:
DPC=Dpf+(πE2/ πE1 )×Dpu =60+(18/5.3)×286 =60+971
=1031 (PPM)
其二:失效率与环境系数不成正比的元器件,以半导体集成电路为主 a) 基本信息:
半导体集成电路的质量等级;半导体集成电路的总量;半导体集成电路工厂缺陷率,PPM;半导体集成电路现场工作小时数;半导体集成电路现场失效率。 b) 确定失效率模型
半导体集成电路失效模型为:
λP=πQ×[C1×πT×πV×πPT+(C2+C3)×πE]×πL (2-4-3) 式中:λP——工作失效率; πQ——质量系数; πT——温度应力系数; πV——电应力系数; πE——环境系数;
C1,C2——电路复杂度失效率; C3——封装复杂度失效率; πL——器材成熟系数;
πPT可编程工艺系数,除可编程序的只读存储器外,其余为一。
可根据半导体集成电路的质量系数和有关技术,确定πE、πQ、πT、πV、πPT 和C1,把它们和已知的现场失效率数据一并代入式(2-4-3),可求得C1×πT×πV×πPT 和C2+C3的值,并分别令其为K1、K2,式(2-4-3)简化为:
λP=πQ×(K1+K2×πE)×πL (2-4-4) 式中:K1=C1×πT×πV×πTP K2=C2+C3
c) 导出现场缺陷率计算公式
现场缺陷率等于现场失效率与现场工作时间的乘积除以元器件总数。从基本信息可得到现场工作时间和元器件总数 ,再利用式(2-4-3)求得的失效率数据,就可导出缺陷率计算公式: DPU=λΡ×Τ/Ν (2-4-5) 式中:DPU——现场缺陷率;
λΡ——统计得到的工厂缺陷率; Τ——现场工作总时间; Ν——统计的元器件总数。
令K3=T/N,合并式(2-4-3)、(2-4-4)、(2-4-5)得: DPU=DPf+Dpu
=Dpf+K3×πQ×(K1+K2×πE)×πL (2-4-6)
式中: DPU——要计算的缺陷率;
Dpf——统计得到的工厂缺陷率; πQ——质量系数; πE——环境系数;
πL ——器材成熟系数;
K1、K2、K3——根据统计数据导出的常数。 d) 示例
已知:进口集成电路的质量等级为C-1,统计的集成电路数量N为624087个,统计的工厂缺陷
6-6
率 Dpf为160PPM,现场总工作时间T为8580×10h,现场失效率为0.025×10/h;求取:该质量等级集成电路的失效率计算公式和缺陷率计算公式。 步骤:根据有关标准确定某些值为:
πQ=13.0 C1=0.0053 πT=0.032 πV=1.0 πPT=1.0 πE=4.0 πL=1.0
代入式(2-4-3): λP=πQ×[C1×πT×πV×πPT+(C2+C3)×πE]×πL 有: 0.025=13.0[(0.0053×0.032×1.0×1.0)+(C2+C3)4.0]1.0 则:C2+C3=K2=0.00044
C1×πT×πV×πTP=K1=0.00017
将上述数据代入式(2-4-4)得到失效率计算公式: λP=πQ×(0.00017+0.00044πE) 现场缺陷率计算公式为: DPU=λΡ×Τ/Ν
6
=λΡ×8580×10/624087
=[πQ×(0.00017+0.00044πE)]×0.0137481
-6
=πQ×(2.3372+6.0492πE)×10
=πQ×(2.3372+6.0492πE) (PPM) 总缺陷率计算公式为: DPU=DPf+Dpu
=160+πQ×(2.3372+6.0492πE) (PPM)
用此公式可以推算其它质量等级和环境下元器件的缺陷率。
4.2.4.3 根据某元器件的缺陷率和失效率求取另一失效率已知的元器件缺陷率 此方法的前提是:假设失效率类似的元器件,其缺陷率也类似。 a) 基本信息
要计算的元器件的失效率λ1;已知缺陷率为DPO的元器件的失效率λ2; b) 计算公式
DPC=DPO×λ2/ λ1 (2-4-7) 式中:DPC——要求解的缺陷率,PPM; DPO——已知的缺陷率,PPM;
λ1——已知缺陷率的元器件的失效率; λ2——要求解缺陷率的元器件的失效率。
此式求解的缺陷率是指某质量等级的该类元器件在某种环境条件下的缺陷率,如果要求解的元器件是在不同环境条件和不同质量等级的缺陷率,则可用本节相应的其它方法求解。其总关系式为:
DPC=(πQ2/πQ1 )[DPU×(πE2/πE1)+DPf] (2-4-8) 式中:DPC——要计算的缺陷率,PPM;
πQ1——已知缺陷率的元器件的质量系数;
πQ2 ——要求取缺陷率的元器件的质量系数; DPU——已知的现场缺陷率,PPM;
πE1——已知缺陷率的元器件的环境系数; πE2——要求取缺陷率的元器件的环境系数; DPf——已知的工厂中缺陷率,PPM。 c) 示例
-6
已知:质量为M等级的进口元器件在地面固定环境中的失效率为0.00207×10;C-1级进口集
-6
成电路在地面固定环境的失效率为0.05123×10,总缺陷率为503.2PPM,工厂缺陷率为160PPM。 求取:质量等级为M的电阻器在地面固定环境中的缺陷率。 步骤:
DPC=DPO×λ2/ λ1
-6-6
=503.2×10-6×(0.00207×10/0.5123×10)
-6
=(160+343.2)×10×(0.00207/0.5123) =6.46+13.87 (PPM) =20.33 (PPM)
求取其它质量等级和环境中的缺陷率公式为:
DPC=(πQ2/πQ1 )[13.87×(πE2/πE1)+6.46] PPM 4.2.5 依据残留缺陷密度的相关性
4.2.5.1 残留缺陷密度与平均故障间隔时间的关系
-6-7
据统计,目前良好的元器件的平均失效率在10/h至10/h之间,现场环境中由潜在缺陷造成
-3
的故障率合理范围是大于10/h。假定装备交付时故障率比规定的故障率λ0大10%是可接受的,且
-3
假定潜在缺陷造成的故障率λD为10/h,根据GJB/Z34提供的故障率与残留缺陷密度的关系式: DR=100λ0 (2-4-9) DR=100/MTBF (2-4-10) 式中: DR——残留在产品中的缺陷密度; λ0——产品规定的故障率,1/h。
根据该标准提供的关系式计算得的缺陷密度与MTBF的关系数据见表2-4-5。
表 2-4-5 残留缺陷密度与MTBF的关系
-3
4.2.5.2 残留缺陷密度与筛选成品率的关系
筛选成品率是指提交验收时产品中可筛选的潜在缺陷数为零的概率。其关系式为:
-DR
Y=e(2-4-11) 式中:Y——筛选成品率; DR——残留缺陷密度。
置信度不同,筛选成品率的下限YL也不同,它是缺陷故障率与无故障试验时间的乘积、缺陷故障率与规定故障率的比值的函数,表2-4-6列出了置信度为90%的筛选成品率下限数据,其它参数的数据可参阅GJB/Z34。
4.3 试验剖面的确定
4.3.1 应力类型
定量环境应力筛选一般选用温度循环和随机振动应力,对电子产品而言,一般都可以满足筛选要求。某些产品有特殊要求的可选用特定的筛选应力。 4.3.2 应力组成
温度循环和随机振动应力各自激发的缺陷类型是不相同的,因此不能互相取代。然而,它们在激发缺陷的能力上却可以互相补充和加强,由振动加速发展的缺陷可能在温度循环中以故障的形式暴露出来;同样,由温度循环加速发展的缺陷也可能在振动中以故障形式暴露出来。因此,环境应力筛选的试验剖面应把温度循环和随机振动组合起来,即随机振动—温度循环—随机振动或温度循环—随机振动—温度循环。可以参阅GJB 1032《电子产品环境应力筛选方法》。 4.3.3 应力量值
筛选应力的量值以不能超过产品的设计极限,能激发潜在缺陷又不损坏产品中完好的部分为原则。
4.3.3.1 温度循环参数的选择
a) 确定温度循环的上下限温度:
采用加电检测性能的筛选方案时,温度循环的上下限温度不高于和低于设计的最高和最低的工作温度。
采用非加电检测性能的筛选方案时,温度循环的上下限温度不高于和低于产品贮存的高温和低温。
采用只在上限(或下限)温度加电和检测性能的筛选方案时,温度循环的上限(或下限)温度不高于(不低于)设计的最高(最低)工作温度,另一侧的温度不低于(或高于)贮存温度。示意图见2-4-1。
温度
1 产品加电筛选时检测性能的温度循环范围 2 产品不加电筛选时的温度循环范围
3 产品加电筛选时检测性能的上限温度循环范围 4 产品加电筛选时检测性能的下限温度循环范围 图2-4-1 温度循环筛选温度范围示意
只对组件进行筛选时,要找出组件中分组件(元器件)各自的最高和最低工作温度、最高和最低贮存温度,温度循环的上下限温度以这些高温中的最低者和低温中的最高者为温度组,参照上述原则进行设计。一般设计的工作温度和贮存温度离设计的极限温度还有一定距离,为了提高筛选效率,有时扩大温度变化幅度,向设计的极限温度靠拢。
示例:某组件由5个分组件组成,其设计的各项温度列于下表,确定其定量环境应力筛选温度。
从表中可得到筛选的工作温度组为60℃和-30℃,贮存的温度组为80℃和-40℃。
b) 确定温度变化速率:
温度变化速率对筛选效果影响极大,应尽可能加快温度变化速率。标准规定设备或部件筛选的温度变化速率不小于5℃/min。由于受筛选产品本身的热惯性,产品的实际温度变化速率远低于试验箱内的空气温变平均速率,因此要根据试验箱的能力尽量提高温度变化速率。 在条件不具备,进行非定量环境应力筛选时,可采用两箱法进行温度冲击筛选。
在定量环境应力筛选过程中,可按定量要求和观察到的故障数调节已选定的温度变化速率,以保证实现定量目标。
c) 确定上、下限温度的持续时间:
温度循环中上、下限温度的持续时间取决于产品在此温度下达到稳定的时间和检测性能所需的时间,可通过对产品的热测定和对试验箱温度稳定时间的测定后确定。
d) 确定温度循环次数:
温度循环次数实际就是筛选的持续时间。根据电子设备早期故障一般在交付的前50~100小时暴露,它与产品的复杂程度有关。一般,初始筛选和单元级的筛选采用10~20个循环,组件级筛选采用20~40个循环。
4.3.3.2 振动应力的选择
a) 确定振动量值
筛选的振动量值一般应低于产品环境鉴定试验的合格值,以不损坏产品为准。常规筛选的随
2机振动量值一般可用0.04g/Hz,把握不大的产品可根据通过测定摸清产品对振动的响应特性,由
低到高适当调整,最后确定振动量值。
b) 确定随机振动频谱
随机振动频谱应采用GJB 1032或GJB/Z34标准规定的频谱,频率范围为20~2000HZ,对少数情况可缩小到100~1000HZ。
应对受筛选产品进行振动测定,确定产品共振频率、优势频率,对产品响应大的频率段、要减少输入,反之加大输入,以保证不损坏产品和实施规定量值的筛选。
c) 确定轴向和时间
随机振动一般要在三个轴向上进行,每个轴向振动5~10min,最少不少于5min。如果产品中多数印制板呈同一个方向排列,则可仅在垂直于印制板方向进行10 min的随机振动。正弦振动也应在三个轴向上进行,一般进行30min,不超过60min。
随机振动的最大效果发生在15~20min内,延长振动时间不仅无益于筛选,反而会引起疲劳损
2伤,一般用0.04g/Hz振动20min。我们可按此数据进行等效振动时间的计算:
3 T=20(W0/W1) (2-4-12)
式中:T——等效时间,min;
2 W0——0.04 g/Hz;
2 W1——所用振动量值,g/Hz。
表2-4-7列出按式(2-4-12)计算的数据。
4.3.3.3 加电和性能检测时间的选择
a) 一般原则
为保证筛选效果,筛选中应尽量进行加电和性能检测,以便发现间歇故障和电应力缺陷。从可能和经济性出发,一般在高装配等级筛选时进行间歇加电和性能检测,低装配等级可能不具备性能检测的条件,需专门设计制造一套检测仪表费用太大,筛选时只好不进行加电和性能检测。 b) 温度循环的加电和性能检测
为了不影响降温速率,在降温过程不加电,为了发现间歇性故障也可加电;尽量在其它温度段加电,期间如果不能做到连续进行性能检测,也应尽量频繁的进行,以便及时发现故障和节省筛选时间。
c) 随机振动的加电和性能检测
在振动过程中,应加电和进行性能检测,以保证及时发现故障、不漏检间歇故障;如果出现
故障后不影响加电和检测,则在振动结束后再修理。
图2.4.2 无故障验收筛选时间T确定过程
4.4 无故障验证试验
4.4.1 无故障验证试验的作用
无故障筛选是环境应力筛选的一个重要步骤,是在完成暴露缺陷的筛选试验之后安排一段试验,要求不再发生因缺陷引起的故障,以便证明筛选目的已经达到,暴露的故障已经排除,证明能在规定的置信度下满足定量筛选的目标。因此又称无故障筛选为无故障验收筛选试验。当试验中发生缺陷型故障时,应重新试验,以保证在规定的时间内不发生缺陷性故障。其作用是:作为筛选圆满程度的度量,作为修复是否完成的度量。
4.4.2 无故障筛选应力的确定
无故障筛选所用应力一般与环境应力筛选应力相同,有条件的也可模拟工作环境应力。
4.4.3 无故障筛选时间的确定
无故障验收的筛选试验时间T的确定方法如下:
a) 搜集信息
受筛选产品预计的(规定值)失效率λ0;
在选定的筛选应力作用下的缺陷故障率λD;
受筛选产品的缺陷平均故障率与规定的故障率之比:λD/λ0;
在给定的置信度下筛选成品率下限值YL。
b) 步骤
无故障筛选时间T的确定过程参阅图2-4-2。
具体如下:
根据产品规定的可靠性值MTBF确定定量筛选目标DRG:DRG=100λ0,λ0=1/MTBF;
计算系统级的缺陷目标DIN;
选定无故障验收的筛选应力,一般与缺陷筛选应力相同;
确定所需的筛选检出度TS=1-DRG/DIN;
确定所用的检测设备及其检测效率DE;
计算所需的筛选度SS=TS/DE;
从有关标准查得所用筛选应力参数和筛选度对应的λD;
将λD除以λ0值;
-D 根据公式YL=eRG求取筛选成品率YL;
确定筛选成品率的置信度,据此和 λD/λ0 值,从有关标准查出λDT值;
按T=λDTλD求得无故障验收筛选时间T。
5 方案的实施与应用实例
环境应力筛选是装备研制生产的工艺过程,装备承制方要编制大纲,在不同阶段按照大纲实施。为了收到预期效果,必须认真做好各项工作。
5.1 样品的准备
无论是在那一个组装等级上进行环境应力筛选,一般都要全数进行。因此,筛选前的样品准备就是全部产品的技术状态准备。其主要工作就是在该组装等级完成装配之后,根据产品的不同情况进行性能检测、性能调试和电缆连接、机械结构的连接和紧固。
5.2 实验室的准备
实验室是进行环境应力筛选的场所,需要提供满足大纲要求符合精度的应力条件和检测设备、标准大气环境条件、仲裁大气环境条件等。
5.2.1 实验室大气环境条件
实验室需要提供标准大气环境条件和仲裁大气环境条件, 标准大气环境条件,主要用于产品筛选前后的性能检测,其温度为15~35℃,相对湿度即为实验室湿度,大气压力即为实验室气压,不加控制。仲裁大气环境条件,用于必要的产品性能检测,以解决有争议内容的仲裁,其温度为23±2℃,相对湿度为50±5%RH,大气压力为86~106kPa,都需要进行控制。
5.2.2 环境应力条件的容差
提供环境应力的设备必须按规定进行定期计量,保证筛选应力的精度。
a) 温度容差
除必要的支持点外,受筛产品应完全被试验箱内空气所包围,受筛产品周围的温度梯度应小于1℃/m,箱内温度不得超过试验温度±2℃的范围。
b) 随机振动容差
随机振动应力条件的容差,GJB 1032作了规定,参阅表2-5-1。容差的dB数按公式(2-5-1)计算。
dB=10lg(W/W0) (2-5-1)
2式中:W—实测的加速度功率谱密度,g/Hz;
2 W0—规定的加速度功率谱密度,g/Hz。
均方根加速度容差不大于1.5dB,其容差的分贝数(dB)由公式(2-5-2)计算。
dB=20lg(GRMS/GRMS0) (2-5-2)
式中:GRMS—实测的均方根加速度,g;
GRMS0—规定的均方根加速度,g。
c) 试验时间容差
标准规定,试验时间的容差为±1%。
5.2.3 试验设备的准备
a) 筛选试验所用的温度循环试验箱应按以下要求进行准备:
产品除必要的安装支点外,都能全部暴露在传热的空气介质之中;
满足高低温范围要求,温度变化速率平均不低于5℃/min;
试验箱内没有直接到达产品的辐射热;
控制箱温的温度传感器应只采集箱内循环气流的温度,而不受产品和箱的辐射热的影响; 箱内气流应使样品周围的温度场分布均匀,并能在样品和箱壁之间自由循环;
能控制箱内气流的温度和湿度,保证在试验期间样品上不出现凝露。
b) 随机振动试验设备及其夹具的准备
随机振动设备必须满足标准规定的应力要求;
夹具在规定的功率谱密度上限频率2000Hz以内不应有共振频率存在,即在20~2000Hz范围内沿振轴方向的传递函数必须保持平坦;,不平坦容差不得超过±3dB,如有困难,在500~2000Hz频率范围内允许放宽到±6dB,但累计带宽在300Hz以内。
c) 通用仪表的准备
通用仪表应有计量合格的证明,测试准确度不应低于测试参数容差的1/3。
d) 筛选记录的准备
为了保证在筛选期间能有效地采集数据、分析故障、记录纠正措施,必须准备相应的记录表,同时参加人员必须熟悉产品性能、接口、检测仪表、试验装置、筛选程序、操作规定等内容。
5.3 环境应力筛选管理
5.3.1 环境应力筛选的计划管理
装备承制方要在产品研制的方案阶段就根据产品可靠性要求和试验条件制定环境应力筛选大纲和计划,并与产品研制计划相协调,纳入研制生产计划网络之中,随着产品研制生产的进度适时安排各项筛选工作。环境应力筛选需要耗费资源,要占用一定时间,要使用技术力量,因此要在研制生产周期和费用的预算方面,在人员安排方面综合考虑这些因素。这样才能使环境应力筛选工作得以落实。
5.3.2 环境应力筛选条件的剪裁
环境应力筛选条件一般按照GJB 1032标准和产品环境应力筛选大纲的规定设计。在筛选过程中,还要根据产品的工艺成熟程度及使用信息对筛选条件进行调整,甚至采用简化或抽样的筛选方案。
a) 简化原则
当产品制造工艺成熟,其MTBF数值很大,接收概率接近100%,且得到定购方的认可,环境应力筛选条件才可以在标准规定的基础上进行简化。
b) 简化方案的选择
其一,抽样筛选方案:抽样按GJB 8052标准规定进行,要求在整个筛选过程中不发生失效,才能判定该批产品通过环境应力筛选,简化有效,否则不能采用简化方案。因此选择抽样筛选方案风险较大。
其二,简化筛选程序方案:筛选的无故障检验阶段的程序时间,可从缺陷剔除试验阶段就开始计算,在标准规定的最大120小时范围内,有连续40小时以上的时间无故障。如果程序的前40小时不出现故障,则可以免去其后的程序时间。
5.3.3 环境应力的筛选程序
无论是一般环境应力筛选还是定量环境应力筛选,其程序由初始性能检测、缺陷剔除试验、无故障检验及最后性能检测等组成。过程示意参阅图2-5-1。
图2-5-1 环境应力筛选程序示意
初始性能检测在标准大气(即实验室大气温度环境)条件下进行,按照有关标准或技术文件进行外观、机械和电气性能检测并记录。凡检测不合格的不能进行环境应力筛选。
环境应力筛选包括缺陷剔除试验和无故障检验试验两个阶段:
缺陷剔除试验,对样品施加规定的随机振动和温度循环应力,先进行随机振动,后进行温度循环。对试验发现的所有故障都要详细记录,在随机试验中发现的故障要待振动结束后排除,在温度循环中发现故障时应即时中断试验,排除后继续试验,并从发现故障的循环起点继续计算试验时间(即扣除发现故障该循环的试验时间)。
无故障检验试验的目的是验证筛选的有效性,先进行温度循环,后进行随机振动。应力量级可与缺陷剔除试验相同,温度循环时间增加到最大80小时,随机振动时间加长到15分钟。无故障检验试验始终要对样品进行功能监测,在温度循环中,应有连续40小时无故障;在随机振动中,应有连续5分钟无故障,验证试验才算通过。如在温度循环的前40小时发现故障,允许排除后继续验证试验;在随机振动的前10分钟出现故障,也允许在排除故障后继续验证试验。试验情况同样要作详细记录。
最后性能检测是将通过无故障验证试验的样品在标准大气环境条件下,按其技术条件逐项检测并记录,将结果与初始检测的结果进行比较,根据规定的验收极限值对产品作出评价。
整个环境应力筛选过程结束后,要编制环境应力筛选报告,作为装备可靠性信息资料保存,纳入可靠性信息管理。
5.4 试验记录与故障信息的综合应用
5.4.1 试验记录的管理
环境应力筛选是装备研制生产工艺的重要环节,对试验过程获得的所有记录、数据、分析报告既要按照承制方的工艺文件管理的规定实施,又要纳入FRACAS管理,防止信息流失。
5.4.2 故障信息的综合应用
环境应力筛选获得的故障信息是宝贵的资源,综合应用故障信息可以获得良好的效益。其作用如下:
a) 用于直接排除产品的缺陷,这是环境应力筛选的首要目标;
b) 用于检查和排除同型号同批次尚未进行环境应力筛选产品的缺陷,有可能实现简化筛选,从而节省资源和时间。
c) 用于修改设计,有可能到达可靠性增长的效果。环境应力筛选暴露的故障,除了来自工艺缺陷、元器件缺陷之外,还可能有来自设计的缺陷,前者按照环境应力筛选的程序加以排除,后者必须对其进行分析、判断,确认属于设计缺陷导致的故障后,反馈给设计部门,可以通过修改设计的方法消除,从而到达可靠性增长的效果。
d) 用于承制单位技术信息数据库保存,为以后产品的性能设计、工艺设计、可靠性设计积累经验,提供依据,提高整体水平。
5.5 应用实例
5.5.1 基本情况
在原国防科工委科技部4局和7局、电科院预研局7处的支持下,在某厂的配合下,作为全国政协提案项目,由电子工业部五所工程中心于1991~1992年对某厂生产的6部某型号短波自适应电台进行环境应力筛选,共暴露了23个故障,连同无故障验收试验共进行了123小时的试验,获得圆满结果,使电台可靠性水平得到提高,收到了生产厂家预料之外的效果。
5.5.2 环境应力筛选方案
由于某厂引进国产化生产该型号电台,技术性能和可靠性指标都照抄原机的,国产化后许多内容尚未定量化,因此没有条件进行定量环境应力筛选,而采用环境应力筛选方案。
5.5.2.1 筛选应力的确定
按照环境应力筛选标准GJB 1032,采用高低温循环和随机振动两种应力组合。
a) 温度循环应力
根据电台设计的工作环境条件温度范围+60℃、-40℃和五所试验设备的能力确定: 产品通电工作筛选温度范围为+60℃、-40℃,试验设备可以提供的温度变化率为+7℃/min、-11℃/min;根据性能检测要求,确定高、低温停留时间各为1.5小时,一个温度循环时间为3.5小时;暴露缺陷的循环次数为10,无故障验收试验循环次数为20。
b) 随机振动应力
按照GJB 1032标准的规定和五所随机振动设备的能力确定:频率范围为20~2000Hz,功率谱
2密度为:0.04g /Hz(在80~350Hz之间),20~80Hz和350~2000Hz功率谱密度变化率为±3dB/倍
频程(见图2.5.2)。
+60℃1.5h +60℃1.5h +7℃℃-11
-40℃ a) 温度循环剖面示意
功率谱密度
频率
20Hz 80Hz 350Hz 2000Hz
b) 随机振动谱示意
图2.5.2 筛选应力示意
5.5.2.2 应力施加步骤
根据GJB 1032标准的规定,应力施加的顺序是:随机振动15分钟→温度循环10个周期(暴露缺陷过程)→温度循环20个周期(无故障验证试验)→随机振动(5~15分钟)。
5.5.3.1 故障记录
6部电台按照环境应力筛选方案和标准规定的程序实施性能检测和环境应力筛选,在剔除缺陷阶段共暴露了23个故障列于表2-5-2。在无故障验收试验阶段未发现故障,6部电台的筛选工作顺利完成。此次筛选还进行了可靠性保证试验的研究,其它情况将在本教材的其它章叙述。5.5.3.2 故障分析
对23个故障进行分析,可以得到以下认识:
a) 随机振动应力筛选效率高,暴露产品的结构和装配工艺缺陷效果很好
该电台的环境应力筛选共暴露了23个故障,其中有19个是在随机振动应力筛选下暴露的,占82%;只有4个故障是温度循环应力筛选暴露的,仅占18%。在随机振动应力暴露的19个故障中,有16个属于工艺缺陷,可见该应力对此类缺陷的暴露效果极佳。
b) 温度循环应力筛选对暴露半导体器件的缺陷效果良好
温度循环应力筛选虽然只暴露了4个故障,但都属于半导体器件的(IC)故障,其中有2个是整机设计的缺陷、有1个是装配工艺的缺陷、有1个是器件失效(器件本身是否有缺陷未作进一步分析),可见温度循环应力对此类器件缺陷的筛选作用是十分显著的。
c) 环境应力筛选能够暴露设计缺陷,可为产品的可靠性增长提供依据
本筛选试验暴露的23个故障中有9个属于设计缺陷,需要采取纠正设计措施才能消除这类故障模式,并可使电台可靠性水平获得增长。这里介绍4个典型例子,供有关人员参考。
其一,晶体滤波器内部晶体片的固定工艺设计缺陷:
筛选中共发生4起晶体滤波器故障,经过解剖检查发现其内部晶体片的固定工艺设计有缺陷,只在晶体的一端靠电路引线固定,而另一端悬空,受到振动应力的激励后脱落。后来改进结构设计,在晶体片的另一端增加固定措施,此后再未发现这种故障模式。
其二,可充电电池的安装设计缺陷:
筛选中发生了可充电电池受震脱落的故障,经分析该电池重量超过14克,工艺设计没有按规范采取捆绑固定措施,而是依靠电池两端的自焊引线与印制电路板连接(波峰焊接),结果经不起随机振动应力的激励。后来采取加捆绑设计而解决。
其三,IC热设计缺陷
筛选中发生2次IC烧坏的故障,经查该器件消耗的功率较大,设计上又没有加装散热片,在温
度循环高温停留段发生过热而损坏,这是热设计的缺陷。后来设计增加不大的散热片,该故障模式消除。
其四,印制电路板某电容器的安装孔距离设计缺陷
筛选中发生过某单元的C39 电容器脱落故障2次,经查是印制电路板的安装孔距离与电容器不匹
配,安装时电容器的引线必须歪斜才能插入,导致波烽焊接后两极的长度不一,固定不牢,在随机振动应力的激励下便发生脱落。这是印制电路板结构设计的缺陷,改进后可以消除这个故障模式。
由此可见,环境应力筛选不仅可以暴露元器件和工艺的缺陷,消除产品的早期失效,还可以暴露某些设计缺陷,起到可靠性增长试验的作用,经过分析采取有效的纠正措施后,同样可以使产品实现可靠性增长,从而使产品可靠性水平比设计值大大地提高。
5.6 注意事项
环境应力筛选是整机研制与生产的工艺过程,每一个产品都必须进行,为了节省资源和时间,要尽量选取效率高的应力条件和费用低的装配等级。随机振动设备和温度循环设备是必备的,承制单位要尽早配备,在配备之前可到附近具备这些条件的单位去实施,此时精选筛选装配等级显得更加重要。
环境应力筛选方案设计是一项综合工作,要掌握产品的设计、工艺、元器件的历史和现况信息,收集必要的数据;选取环境应力筛选或是定量环境应力筛选、选取何种筛选装配等级时,都要承担一些风险。因此,必须应用系统工程方法,围绕产品可靠性要求进行综合权衡。
环境应力筛选与可靠性增长试验同属于可靠性工程试验,它们有相同的总目标,也有各自的特点,可以相互补充却不能相互取代,可以应用环境应力筛选做一些可靠性增长的事情,以充分应用环境应力筛选的结果,提高试验效率。
第三章 可靠性增长试验
1 概述
1.1 基本概念
众所周知,装备的可靠性是由设计决定的。但是,由于受到各种原因的影响,设计缺陷总是难免的,产品在研制阶段往往达不到用户的可靠性要求,因此必须开展可靠性增长活动。
必须指出,可靠性增长活动不是针对设计低劣的产品的,而是针对经过认真设计仍然由于某些技术原因达不到要求的产品,而且可靠性增长活动比可靠性设计活动所需的资源和时间都多,因此,管理者往往只对通过可靠性设计评审的产品才安排可靠性增长计划。那种把可靠性水平寄托在增长活动上的态度是错误的。
可靠性增长的核心是消除影响产品可靠性水平的设计缺陷。可靠性增长的关键是发现影响产品可靠性水平的设计缺陷。为此,必须通过试验或运行的途径来实现产品故障机理的检测。常见的可靠性增长有,一般性的可靠性增长和可靠性增长管理。
一般性的可靠性增长,是指事前未给出明确的可靠性增长目标,对产品在试验或运行中发生的故障,根据可用于可靠性增长资源的多少,选择其中的一部分或全部实施纠正措施,以使产品可靠性得到确实提高的过程;它通常不制定计划增长曲线,也不跟踪增长过程,而是采用一两次集中纠正故障的方式,使产品可靠性得到提高。由于增长过程通常不能满足增长模型的限度条件,增长后的产品可靠性水平需要通过可靠性验证试验才能进行定量评估。
可靠性增长管理,是指有计划有目标的可靠性增长工作项目,并非可靠性增长过程中的管理工作。它是产品寿命期内的一项全局性的、为达到预期的可靠性指标、对时间和资源进行系统安
排、在估计值和计划值比较的基础上依靠新分配资源、对实际增长率进行控制的可靠性增长项目。可靠性增长管理有两个特点:
a) 有一个逐步提高的可靠性增长目标
可靠性增长管理主要针对大型军事装备,把可靠性增长工作从工程研制阶段延伸到生产阶段或使用阶段,在阶段的转接处和阶段内部划分的小阶段的进出口处设定可靠性增长目标,形成逐步提高的系列目标。这就促使有关部门实施严格管理和为降低风险提供手段。
b) 充分利用产品寿命期内的各项试验和运行记录
除了可靠性试验之外,在产品寿命期内还有其它各种试验以及运行过程都可能产生故障信息,可以用于可靠性增长的故障机理检测,经过风险权衡后把其中的一部分纳入可靠性增长管理的范围,形成可靠性增长的整体,使产品可靠性逐步增长到预期目标。
可靠性增长活动是一个连续完整的闭环控制过程。在此环中,首要任务是发现产品的设计缺陷——这主要是从试验、使用中发生的故障中发现;然后是对故障进行分析——重点研究重复性故障和关键故障发生的原因,当认定为设计缺陷后提出纠正这些设计缺陷的措施;接着是实施纠正措施——将修改设计的措施在少数产品(试验样品)上实施,并通过试验验证纠正措施的有效性;最后是修改技术文件和把纠正措施推广到同型号产品中去——这是落实可靠性增长活动的重要工作,是发挥可靠性增长试验效益的关键步骤。可靠性增长活动可以在工程研制阶段、生产阶段进行,甚至在使用阶段进行。按照有关标准的规定只在装备研制阶段才进行可靠性增长试验和增长工作,但从我国的实际情况出发,有不少已经装备部队多年的产品仍然对其进行可靠性增长试验和“可靠性补课工作”,并取得了显著成绩。这就是说,要根据产品的技术状况和可靠性水平去决定何时以何种形式开展可靠性增长活动。
图 3-1-1 可靠性增长工作流程示意图
可靠性增长试验是可靠性增长活动的主要内容,是产品工程研制阶段单独安排的可靠性工作
项目,成为工程研制阶段的组成部分。可靠性增长试验通常安排在工程研制基本完成之后和可靠性鉴定试验之前进行。此时,产品的性能与功能已经基本达到设计要求,产品结构与布局已经接近批生产的要求,故障信息的确实性已经较高,且此时故障纠正措施的实施所需资源和时间较少。使用阶段的可靠性增长活动可以利用产品的现场故障信息和现场使用状况记录来取代可靠性增长试验工作。
1.2 可靠性增长试验的目的
可靠性增长试验的目的是,在装备研制或生产阶段通过试验获得设计缺陷的信息,以便对其进行分析和采取纠正措施,及早解决大多数可靠性问题,提高产品可靠性水平。
1.3 可靠性增长的原理
可靠性增长试验的方法原理是,将研制生产的产品置于实际使用的环境(模拟工作环境或加速变化的环境)应力条件下经受一定时间的试验,使产品的设计缺陷暴露为故障。可靠性增长试验以管理过程请参阅图3-1-1。
1.4 可靠性增长试验与环境应力筛选的对比
可靠性增长试验与环境应力筛选同为装备研制生产的可靠性工程试验,它们的目标都是为了暴露产品缺陷,但在具体任务上有明显区别,前者旨在暴露某些设计缺陷,纠正后提高产品固有可靠性水平;后者旨在暴露工艺和元器件、原材料的缺陷,消除产品潜在的早期失效,并非为了提高产品的固有可靠性水平。表3-1-1列出了它们的主要对比项目。
1.5 可靠性增长试验与可靠性鉴定试验的关系
可靠性鉴定试验是可靠性统计试验工作项目,它作为产品在工程研制阶段的全部可靠性工作成果的考核,可以判定产品可靠性是否达到了预期的目标。可靠性增长和可靠性增长管理虽然可以帮助人们了解产品的可靠性水平,并不能取代可靠性鉴定试验,因此可靠性鉴定试验仍然要作为重要工作项目列入可靠性大纲。只有当可靠性增长试验成功、满足以下条件,并能用数理统计方法对产品可靠性进行评估时,经过定购方的许可,才可以用可靠性增长试验替代可靠性鉴定试验。
a) 可靠性增长的试验剖面与可靠性鉴定试验规定的试验剖面相同;
b) 可靠性增长试验记录完整,试验过程跟踪严格;
c) 有完善的故障报告、分析和纠正闭环系统,故障纠正过程有可追溯的详细记录;
d) 可靠性增长试验结果的评估是可信的,即评估所用的数学方法恰当,置信水平选取符合要求,产品可靠性评估结果高于或等于计划的可靠性增长目标。
2 可靠性增长计划
2.1 制定可靠性增长计划的原则
装备承制单位在产品的研制与生产过程中,都要致力于促进产品的可靠性增长。产品可靠性的有计划增长,就是人们预期的可靠性增长,其特点是在产品研制各阶段和生产过程都设有相应
的增长目标值。为此,人们必须制定一个完整的可靠性增长计划。
制定可靠性增长计划的原则是,围绕可靠性增长曲线安排工作内容、进度、资源、经费等。 确定产品可靠性增长曲线的方法是,根据同类产品研制所得的数据,经过分析,建立可靠性增长模型,确定其可靠性增长试验的时间长度;同时根据产品的可靠性指标,作为点估计值拟定可靠性增长曲线;据此安排试验项目、时间起点、预定的可靠性增长率等。
2.2 可靠性增长计划的主要内容
a) 试验的目的和要求;
b) 受试产品及其应进行的试验项目;
c) 试验剖面、产品技术状况、性能和循环工作周期;
d) 试验进度安排;
e) 试验设备和装置的说明及要求;
f) 用于改进设计所需要的资源和时间要求;
g) 试验数据的收集和记录要求;
h) 故障报告、分析和纠正措施;
i) 试验结果和产品的最后处理;
j) 其它有关事项。
2.3 研制生产和使用阶段的可靠性增长
如前所述,可靠性增长管理,把可靠性增长活动已经打破某些标准的规定界限,从研制阶段延伸到生产阶段,扩展到使用阶段,形成一种动态的工程过程。这既保持了有关标准规定的可靠性增长的内涵,遵循“试验——分析——改进”的规律;又灵活地运用了产品的故障信息,发挥故障审查组织和故障报告、审查与纠正措施系统的作用,使得可靠性增长活动变得生动活泼,成果日新月异。
2.3.1 研制生产阶段的可靠性增长
研制与生产阶段的可靠性增长是某些标准所规定的工作项目,它必须通过试验暴露设计缺陷,才能达到增长的目标。然而,研制阶段与生产阶段的可靠性增长又有所区别:前者完全靠可靠性增长试验发现设计缺陷,完全靠改进设计来达到增长的目的;后者则可以通过环境应力筛选或老练活动暴露设计和工艺及元器件的缺陷,不仅要消除产品的早期失效,还可以消除某些设计缺陷,以此达到增长目的。
2.3.2 使用阶段的可靠性增长
装备使用阶段的可靠性增长,某些标准把它作为可靠性增长管理的部分工作,这主要是通过可靠性信息管理中的故障报告、分析和纠正措施系统与故障审查组织的作用去实现。其中设计缺陷由故障审查组织通过分析产品现场使用的故障信息发现;纠正措施由该组织提出,经过装备的承制单位或使用单位实施和验证后得到确认;验证信息由信息管理系统反馈后,由有关单位发出该纠正措施的技术更改通知给产品的生产单位、经销单位、使用单位等方面一并落实,至此才完成了可靠性增长的完整过程。
3 可靠性增长试验的实施
可靠性增长试验的实施就是落实可靠性增长计划,要根据产品可靠性工作大纲制定试验计划,要确定试验剖面,要准备样品,准备试验设备和检测仪表及记录表格,要编制试验操作规程,准备纠正设计缺陷和排除故障所需的资源,要对参加试验的人员进行培训等等。其中主要工作如下。
3.1 试验剖面的确定
可靠性增长试验的目的是暴露产品在使用状态下的问题和缺陷,因此试验剖面要模拟实际的使用环境条件。实际使用环境条件又称任务剖面。对某些产品来说,可能有多种任务剖面,此时可取其中有代表性的典型任务剖面作为可靠性增长试验的试验剖面。如果选择不到典型任务剖面,则选取环境条件最恶劣的任务剖面作为可靠性增长试验剖面,这样最有利于暴露设计缺陷。
3.2 试验记录与故障分析
3.2.1 试验记录
无论在何种状况下进行可靠性增长试验,都必须对试验的全过程进行详细记录,要记录样品的技术状况和故障表现。这些资料是分析和判定设计缺陷、提出纠正措施的基本依据。记录的内容可参考有关标准导则所附的表格,以便统一可靠性增长试验和可靠性增长管理及可靠性信息系统所用的表格。
3.2.2 故障分析和处理
可靠性增长试验中记录的故障,并非都是由于设计缺陷造成的,有的可能是由于早期失效或元器件的随机失效产生的。可靠性增长活动所关心的是由于设计缺陷引起的故障。为了弄清故障原因,必须进行故障分析。故障分析工作主要由直接研制产品的人员或产品总体设计人员负责。分析工作从故障表现人手,首先分辨和排除人员操作不当引发的故障,再分辨和排除元器件质量问题导致的故障,余下的故障要分析和检测是由于元器件参数使用不当(包括降额设计不到位)还是由于环境条件苛刻(包括环境防护设计、热设计、减振设计)所至,必要时要对分析结论进行验证,为正确的纠正措施提供依据。凡不需要采取纠正措施的故障,都按照通常的维修加以排除;需要采取纠正措施消除的故障则按照下一节的要求进行处理。
3.3 纠正措施的确定与验证
故障分析列出了设计缺陷引起的故障和消除这些缺陷的方法,把它编写成为设计更改通知,就成为可靠性增长的纠正措施。但是必须注意,纠正措施必须优先针对那些会降低产品的作战效能、增加维修和后勤保障费用的故障。纠正措施必须先在试验样品上实施,之后对样品施加使用环境应力(即可靠性增长试验剖面)试验,验证该设计缺陷是否消除。如果仍然发生该缺陷引发的故障,则说明增长无效,需要重新分析故障原因和纠正措施,按照上述程序再来一遍,直至该缺陷被消除。
当经过验证纠正措施有效,设计缺陷已经消除,此时应及时把设计更改通知上升为产品正式技术文件,并且要求其它产品也按此文件实施,做到图文一致、图文和实物一致。如果可靠性增长试验是对某些装备进行“可靠性补课”,则纠正措施要上升为技术更改通知发到已经持有该产品和正在生产该产品的单位,要求所用产品都按照此文件进行更改和生产,以受到可靠性增长的目的。
3.4 注意事项
3.4.1 关于可靠性增长的数学模型
就可靠性增长的内涵而言,在制定可靠性增长试验计划之前,要根据产品可靠性目标和刚研制完成产品的可靠性估计值设计增长模型,并要作出计划曲线。目前,在可修产品的可靠性增长试验中,普遍使用杜安(Duane)模型,为使模型的适合和使最终评估结果具有较坚实的统计学依据,也用AMSAA模型作为补充。本章实例采用AMSAA模型,读者可结合实例和参考有关书籍和资料去熟悉这些数学模型。
3.4.2 关于可靠性增长的试验时间
可靠性增长的总试验时间包括:把产品设计缺陷诱发为故障的时间和验证故障纠正措施是否有效的时间。因此,没有足够的试验时间是达不到预期目标的。试验时间直接关系到可靠性增长
资源的需求,因此发生供需矛盾。总试验时间可以根据增长目标和增长模型进行计算,但模型中有一些参数也不是完全确定的,因此往往经验数据在起作用。工程实践经验表明,可靠性增长的总试验时间等于增长目标(Mabj)的5~25倍。在实际应用该经验关系式时,要根据产品情况决定倍数,对高可靠性目标的产品和高增长率的产品,可以选取低倍数,减少总试验时间,但可能会增大可靠性增长试验达不到预期目标的风险。此外,还必须注意,总试验时间应包括纠正措施的验证时间。
3.4.3 关于试验样品
可靠性增长试验的样品,从工程研制的产品中选取。而工程研制的产品数量有限,往往要作为多种试验项目的样品来使用。因此,必须适当地安排各种试验的程序,以免拖延研制进度。按照通常的要求,试验程序是:首先进行环境应力筛选,消除工艺和元器件、原材料的缺陷,而且有利于缩短以后试验项目的试验时间;其次按照GJB 150的规定进行环境试验;最后进行任务剖面或寿命剖面的综合环境应力的可靠性增长试验或鉴定试验。
4 可靠性增长活动的管理工作
4.1 建立故障信息管理系统
开展装备的可靠性增长活动必须建立故障信息管理系统,统一管理装备故障信息。承制单位一般都要建立全厂(所)的信息中心,建立产品和元器件、原材料的数据库。装备的故障信息可纳入这些数据库进行管理。故障信息管理系统必须制定严密的信息收集、发布、刷新、交接处理等规章制度。一般要求所有装配等级的产品从装配完成之后发生的所有故障都要填写故障信息表格,实时传递给信息中心;信息中心除了及时录入数据库之外,还要实时向产品技术管理部门发布,向计划管理部门和质量(可靠性)管理部门通报。
4.2 建立以装备为对象的故障审查组织
承制单位信息中心收集故障数据的目的不仅仅是为了建立数据档案,为开展产品论证提供依据;更重要的是为产品的质量改进和可靠性增长提供依据。最直接应用故障信息的是产品研制生产部门。为了有针对性地应用故障信息,建立以装备型号为对象的故障审查组织是最好的办法。因为他们最了解装备的技术状况,对故障信息最敏感,对故障原因和解决办法最有发言权,因而可以用最少的资源去实现可靠性增长的目的。产品故障审查组织一般由总设计师负责,产品各有关部分的设计师参加,信息管理系统也应派员参加。该组织为非常设机构,但在可靠性增长中起着十分重要的作用。因此承制单位必须及时建立每个型号产品的故障审查组织,制定该组织的管理规章制度,并重视发挥他们的作用。
4.3 纠正措施的追踪
故障纠正措施一经确立和验证,设计更改文件发出,管理者必须对已有的产品进行跟踪,直至每一部装备都落实这些纠正措施为止。落实纠正措施是扩大可靠性增长试验成果的重要步骤,其难度也很大,因为产品分布面可能很广。发挥各方面的力量,尤其要发挥用户和维修系统的作用,有可能使纠正措施得到顺利落实。
4.4 验证信息的收集
当产品通过可靠性增长管理的方式进行增长时,纠正措施的验证往往是在使用现场实现的。此时验证信息需要通过管理渠道进行收集,这是需要注意的。因为信息管理系统主要收集故障数据,验证数据属于专项工作,需要进行专项管理才能做好。
4.5 可靠性增长报告
无论采取什么方式使产品可靠性获得增长,最终都需要编制可靠性增长报告,作为技术资料
存档。报告内容要符合有关标准的要求,要把试验过程、故障状况、分析结果、纠正措施及其实施、验证结论、增长后产品可靠性评估(数据处理)等内容详细记载其中,使报告具有良好的参考价值和可追溯性。
5 实例
5.1 基本情况
我国航空电子设备的可靠性工作起步较晚,为了摸清主要机载电子设备的可靠性定量水平和提高其可靠性水平,“六五”后期国防科工委和空军给电子部(当时为机械电子工业部)下达了部分机载电子装备可靠性补课的任务。为了完成此项前所未有的任务,部军工司把任务下达给电子系统可靠性专业研究所——第五研究所。五所工程中心领受了此项任务后,在国内外很少报导过可靠性补课工作具体方法的情况下,学习消化了GJB 450《装备研制与生产的可靠性通用大纲》和GJB 899《可靠性鉴定和验收试验》以及国外有关标准,针对不同装备设计了各自的“可靠性增长和测定试验方案”,从“七五”初期开始试验,用了三年多时间,对10种50多台机载电子设备进行了累计6000多小时的综合应力试验(15300多装备台时),顺利地完成了可靠性增长和测定任务,取得了良好效果,使受试产品可靠性水平普遍提高了2~10倍,摸清了它们的可靠性定量水平。
他们的具体做法是:按可靠性鉴定要求拟制试验方案,在试验中与装备承制单位共同分析发生的故障,并对其中关键故障采取切实可行的纠正措施,在承制方落实纠正措施后,在征得用户同意后,对试验发生的所有故障重新进行失效分类,经过数据处理,获得设备可靠性定量值和增长率等参数。这一整套可靠性补课工作方法,既坚持可靠性工作的严肃性和科学性,又充分考虑国情,充分利用综合环境应力试验的数据,发挥承制、定购、试验三方的积极性,巧妙地把可靠性鉴定试验和可靠性增长试验、可靠性增长试验和可靠性增长管理的工作结合在一起,用最少的资源达到可靠性补课的目标,受到各级管理机关和用户的好评。
5.2 可靠性补课工作的主要内容与程序
5.2.1 主要工作内容
根据上级主管部门的要求,不同设备的可靠性补课工作的内容有一些差别,但要求测定产品的可靠性定量水平和实现可靠性增长方面是一致的。
可靠性补课工作,无论是从时间上还是从工作程序上,我们都不可能象对新研制产品一样要求按《装备研制与生产的可靠性通用大纲》去操作;而只能从实际出发,按主管机关和订购方的要求,选择主要工作项目,排出每项工作的操作程序,按分工制定各自的工作计划,分头去实施。
5.2.2 有关各方的主要工作
a) 装备承制方的主要工作
装备承制方的主要工作是:在五所的指导下,对进行可靠性补课的产品重新开展可靠性预计和可靠性设计评审,进行工艺标准化、元部件的检验筛选,整机“三防”处理,单元和整机的环境应力筛选等工作,切实消除产品的早期失效;进行专用检测仪表的计量、性能参数测试记录表格的准备;试验中负责性能参数的测试,故障的排除。
b) 五所的主要工作
五所承担任务的人员的主要工作是:熟悉可靠性补课产品的战术技术性能,了解其可靠性现状,指导承制方做好产品可靠性鉴定试验的准备工作;根据空军主管机关或用户提供的任务剖面研制试验剖面,编制鉴定试验方案(内容包括:样品数量、试验剖面、承制方和定购方的风险系数α、β,可靠性置信上限值θ0 、下限值θ1 ,鉴别比d、失效判据、接收相关失效数r、总试验时间、性能参数检测内容等),报军方主管机关和上级主管部门审批,并抄送承制方;做好试验设
施的准备,试验中保证综合环境应力符合方案要求等。
c) 军方主管机关和工业部主管部门的主要工作
军方主管机关和工业部主管部门的主要工作是:负责组织向五所提供产品的任务剖面,以便制定试验剖面;在收到五所上报的鉴定试验方案后,及时组织有关专家和参加试验各方进行评审;及时协调各方的工作进度;指派产品军代表参加试验工作;适时拔付经费;补课工作结束组织会议,评审或总结可靠性补课工作。
5.2.3 试验程序
在各方都做好准备、试验方案通过评审、各方参加试验人员和产品到达五所之后,组成试验小组,开始可靠性鉴定与增长试验工作。一般试验程序为:
a) 组织参试人员熟悉试验方案和有关规定,明确分工;
b) 在实验室常温条件下检测和记录全部试验样品的性能参数;
c) 安装试验产品于试验设备之中;
d) 一般进行一个循环的试运行,若未发现异常则开始进入正式试验程序;如有异常情况则在排除之后再进入;
e) 严格按照规定进行综合应力试验,进行性能测试、记录;
f) 当样品发生故障时,待温度循环到常温值时暂停试验和拆卸故障样品,以排除故障;同时安装备用样品,继续试验;
g) 故障由承制方和其它各方的参试专家共同分析,如果确认属于设计缺陷时,提出纠正措施,并由承制方负责实施;完成后在后续的试验中验证措施是否有效;
h) 在各方都确认纠正措施有效后,便可把该故障模式已被消除的结论记录在案,实现了可靠性增长;否则把该故障判定为相关失效,影响产品可靠性定量水平和接收或拒收的结论;
i) 试验结束后,由五所进行试验数据的处理,并出具可靠性增长试验报告和可靠性测定试验报告及总结材料。
j) 最后由军方主管机关和上级主管部门组织召开总结会议,请专家和领导对该产品的可靠性补课工作进行评审。
5.2.4 制定试验方案
现以某机载雷达为例,五所工程中心参照GJB 899和美军标MIL-HDBK-781,征得军方和承制单位的同意,选取了标准型定时截尾试验方案17,具体参数是:
判断风险标称值α=β=20%;
承制方实际风险值α’=17.5%,定购方实际风险值β’=19.7%;
鉴别比d=θ0/θ1=3.0;
试验截尾时间,即总试验时间T=4.3θ1=645小时(定购方与承制方协商确定的可靠性目标值θ1=150小时);
接收判据:失效次数r≤2;拒收判据:失效次数r≥3;
失效判据按雷达技术说明书确定;样品数为3;
试验剖面按上级批准的执行;
根据总试验时间和试验剖面,实际需试验94个循环周期,每周期为7小时(指施加综合应力时间),共658小时。
5.3 试验实施情况记录
5.3.1 试验中样品发生的失效情况
在试验时间T内,样品共发生了7次失效(见表5-3-1)。
5.3.2 故障分析与纠正
经分析,上述7个故障中可以采取纠正措施消除掉5个:
a) 序号1和3的失效属重复失效,在五所试验现场采取措施后,经过其后的试验,充分验证该模式已经消除;
b) 序号2的失效模式,在五所试验现场采取措施纠正后,经过其后的试验,充分验证已经消除;
c) 序号4和5的失效,未分析出准确的原因,认为是随机性故障,暂时无法采取措施消除,不予增长;
d) 序号6的失效模式,现场无法采取措施纠正结构设计,但可在承制单位采取纠正措施予以消除,试验现场只作恢复性修理,未验证;
e) 序号7的失效,经分析属降额设计缺陷,电容器电压降额系数选取过小,耐压由设计的63V改为160V后该模式可以消除,采取纠正措施后所余试验时间已不多,验证不充分(由于本试验方案主要为可靠性鉴定设计而不是专门为可靠性增长设计的,因此按定时截尾结束试验)。 以上所有有效的纠正措施都改变了产品的技术状态,使其可靠性获得了增长。
5.3.3 可靠性增长数据处理
一般说来,承制方在进行样品准备的环境应力筛选中,已经暴露了一部分设计缺陷,并采取了纠正措施,产品的可靠性已经获得了初步的增长。但在可靠性鉴定试验阶段,样品要在综合环境应力试验设备上经受模拟任务剖面的考验,仍然会发生新的失效。我们从实际情况出发,根据可靠性增长的内涵,对试验中发生的失效及时进行分析,凡是确认为设计缺陷的、可以采取纠正措施的失效,都由承制方在五所试验现场落实纠正措施,并在余下的试验时间内验证;在五所试验现场没有条件落实纠正措施的作为跟踪项目由承制方在试验后落实。
因此,试验数据的处理,除了按照可靠性鉴定试验要求处理增长后(对失效从新分类)的MTBF值之外,还在假定失效率为指数分布的前提下,用AMSAA模型进行了可靠性增长的数据处理工作,从研究的角度出发,还采用了定数截尾/定时截尾方法进行产品增长前的MTBF值的求解,以便求解可靠性增长率,并进行比较。
a) 按照定时截尾鉴定试验处理数据
按此方法处理的结果,可作为产品可靠性定量评价的主要依据。
前提条件:失效率符合指数分布;7次失效经过工作消除了5次,关联失效为7-5=2;总试验时间为658小时。
求观测值(点估计值):
T/r658/2329(小时) (3-5-1)
求r=2和80%的上下置信限:
查GJB 899标准的相关表可得上、下置信限值的系数分别为2.426和0.457,用它们与相乘得:
U=2.426×329=798.2(小时)
L=0.457×329=150.4(小时)
这表明:产品真实的MTBF值处于150.4和798.2小时之间的概率为60%,≥150.4小时的概率为80%,≤798.2小时的概率也为80%。
b) 求产品可靠性增长前的MTBF值
在整个试验期间,发生过7次故障,如果没有进行可靠性增长工作,按照故障发生的时间组合可以处理出多个MTBF数据,这是雷达可靠性增长前的MTBF值。
其一,按照定数截尾方法处理
前提条件:拒收判决条件r=3,试验中发生的前3个故障皆为关联失效;
方法思路:将拒收条件发生时的试验时间作为临界值,进行定数截尾数据处理;
求解过程:
由表3-5-1查得Tr=3=265.9 小时,观测的MTBF值为:
=265.9/3=88.6(小时)
以r=3、置信区间为60%,查GJB 899标准中的有关表得到上、下置信限值的系数分别为
1.954和0.701,按上法求得:
U=1.954×88.6=173.1(小时)
L=0.701×88.6=62.1(小时)
处理结果数值的含义同前。
其二,以试验最后2个失效和直到试验截尾的时间,按照定时截尾方法处理数据
前提条件:假定表3-5-1中第五个失效及其以前的试验时间作废(视为摸索试验),自试验的293.5小时开始重新统计试验时间,到试验结束共做了658-293.5=364.5小时,共发生2次失效,也都认为是关联失效,但未到达标准型定时截尾试验方案的截尾时间,提前进行可靠性水平的估算,数据处理结果为(过程同前):
=364.5/2=182.3(小时)
U=2.426×182.3=442.3(小时)
L=0.457×182.3=83.3(小时)
c) 按可靠性增长试验的AMSAA模型方法去处理试验数据
前提条件:把可靠性鉴定的定时截尾试验看作可靠性增长试验;
处理过程:
按照有关标准要求进行,包括符合性检验,其计算过程中的中间结果和最终结果列于表3-5-2。
表中:
A=LnXi
B=LnX
i C=Xi/t0
D=(Xi/t0)
E= 2i1 2M
F=[ (Xi/t0)
G=
i1M- 2i1] 2M2i1] [ (Xi/t0)- 2M22计算过程:
增长显著性检验:
=N/[Nln(t0)
i1Nln(Xi)] =7/[7×6.489—37.711]=0.908
[M/N]
=(6/7)×0.908=0.778 N/(t0)=7/6580.908=0.0193
0.778 N/(t0)=7/658
=0.0449 C2
M1/12M[(Xi/t0)(2i1)/2M]2
i1M
=0.0139+0.1421=0.156
式中:t0=658 h是总试验时间。
从有关标准的χ表中可以查得在M=6和显著性水平为0.1(α)时克莱默-冯·梅赛斯统计量2
C2
M的形式参试临界值为0.162,比本试验数据求解的结果0.156大,因此检验认为本试验可以接受AMSAA模型,即系统的密度函数可以作为时间函数来计量。
由于本试验的Xi=7
(t0)
2t10 —0.222 =0.778×0.0499×658=0.00827 从有关标准的χ表中可以查得MTBF的置信区间因子:
L7,0.8=0.487
U7,0.8=2.616
MTBF的置信区间为:
L7,0.8/(t0)≤MTBF≤U7,0.8/(t0)
结果为:0.487/0.00827≤MTBF≤2.616/0.00827;
即:58.9h≤MTBF≤316.3h。
MTBF的平均值为:
M(t0)=1/(t0)=1/0.00827=120.9h。
d) 求可靠性增长率
把上面求解的可靠性增长前后的数据加以计算可以获得增长率数据,数据处理结果见表3-5-3。
d) 结果分析与说明
从表3-5-3可以看出,不同的数据处理方法计算的MTBF及其增长率有所不同,该雷达的MTBF已经超过指标要求(150小时),其可靠性增长的趋势十分显著。由AMSAA模型求解可靠性增长率为1-=1-0.778=0.222(22.2%),与其它方法求解的结果接近。这说明本试验应用AMSAA模型作数据处理是合理的。 ___
第四章 可靠性验证试验
1 概述
1.1 试验目的与分类
可靠性验证试验的目的是验证产品的可靠性是否达到规定的要求。
可靠性验证试验根据产品的性质分为可靠性鉴定试验和可靠性验收试验。
可靠性鉴定试验是为了验证新开发产品的设计是否达到规定的最低可接收的可靠性定量要求。
验收试验是对正式转入批生产产品是否达到可靠性定量要求的试验。
1.2 统计概念
可靠性指标是产品性能的时间表征,是随机变量,无法用仪表检测,只有通过抽样试验或全寿命统计才能检验。
产品的可靠性使用指标,也是可靠性目标值,在合同中又称规定值,试验方案中可为θ0。 产品必须达到的可靠性使用指标称可靠性门限值,在合同中叫最低可接受值,试验方案中为θ1。
可靠性验证试验方案建立在统计数学基础上,与“个体”、“总体”、“批”、“样本”、“样本量”、“随机抽取”、“分布”等等统计学概念有关。
电子产品在寿命的随机失效期的故障率为常数,符合指数分布。
1.3 一般要求
试验大纲必须经过有关方面讨论批准。
统计试验方案由订购方在合同中规定,从有关标准中选定。
试验样品的技术状态应是经过批准的。
试验剖面应代表实际使用环境条件。
试验应在授权的实验室在用户代表监督下进行。
2 可靠性验证试验大纲
2.1 试验大纲内容
试验对象和数量;
试验目的、进度;
试验方案;
试验条件:试验设备提供的应力及其容差、检测设备及其精度要求;
试验场所,经订购方认可按以下顺序选定:独立实验室,合同乙方以外的实验室,合同乙方的实验室;
设置评审点、开展FRACAS要求。
2.2 试验方案
A 根据大纲要求制定试验方案,内容包括:
试验项目;
选定统计试验方案:号码、鉴别比D、风险α和β、试验时间T、样品数量、是否可替换; 试验剖面;
故障判据及分类;
有关试验方职责分工;
计划进度、经费、人员、维修器材等资源保证条件;
其它可靠性活动信息。
B 试验方案选定因素
定时截尾试验,累积试验时间是确定的,便于试验计划安排和管理,但不一定是最经济的;
定数截尾试验,累计相关故障数是确定的,在采取不可替换的试验时,样品数量是也确定的,也不一定是最经济的。
等概率比序贯试验,做出判据所需的故障数和累计试验时间比定时截尾和定数截尾试验的少,事前只能确定它们的最大值,但样品数量和试验时间难以确定,不便于试验计划安排和管理,最大累积试验时间和累计故障数有可能超过定时截尾或定数截尾的试验。 2.3 试验条件
可靠性验证试验剖面应典型代表产品的使用条件:
功能模式,当产品有超过1种使用模式时,应分析各自所占时间的百分比,确定模式转换的方式,提出试验用典型工作模式;
输入信号,试验中测试设备向样品输入一系列信号,使样品正常工作; 负载条件,样品输出端应模拟使用状态加载,测试样品输出性能; 样品操作,试验中由产品操作人员模拟使用状态进行操作;
保障条件,实验室提供的电源、水源、气源等的各项参数应符合要求;
试验剖面,尽量采用综合应力试验设备模拟产品使用条件,同时对样品施加温度、湿度、振动、低气压等应力;
样品维护和修理,试验大纲可能规定样品有定期维护的程序,应按照产品使用说明正常维护,不得改变其技术状态;样品发生故障,应准予修理,由承制方保证条件并实施,不得改变样品技术状态。 2.4 试验程序
应根据试验方案制定试验程序,经订购方审批后作为落实试验计划的文件,内容包括: 试验过程;
样品及其技术状况;
需检测的特性参数、故障判据及其容限、检测时段及方法; 综合环境条件及其容差;
试验日志及记录的数据内容、记录时间间隔要求; 故障记录表格及其登记内容、分析报告要求;
中断试验的规定,定期维护时间、故障发生之后、试验条件超出容限无法纠正时、行政管理需要时;
样品故障的处置程序,及时记录故障现象和发生的应力条件及操作动作、确认故障、报告试验负责人、在温度到达常温点中断试验、取出故障样品、修理样品或继续试验(在不可替换方案中,待样品修理检测正常后;在可替换方案中,装上备份样品后)、分析故障明确是否关联、FRACAS、记录故障处理过程。 2.5 试验评审
试验评审包括:试验大纲评审、试验方案评审、试验程序评审、试验准备状态评审、试验中评审、试验完成综合评审。前4项评审可以结合在一起进行,必须有订购方代表参加;试验中评审视情况进行,如对故障处理和试验进度、序贯试验终结与否进行评审,由试验现场负责人组织实施;试验完成综合评审,应在试验报告编制完成之后进行,评价试验结果、产品可靠性水平及其接收与否的结论、FRACAS报告、问题处置和纠正措施的落实等。 2.6 联合试验小组
联合试验小组由试验方、承制方和订购方代表组成,包括试验、总体、设计、生产、质量可靠性等专业人员,一般由试验方任组长、承制方和订购方任副组长,负责协调实施试验大纲,具体工作:
执行试验评审和试验程序,审核试验数据,审批样品故障的分类和FRACAS的纠正措施,审批试验中断程序。 2.7 试验报告要求
试验报告是产品可靠性水平的正式记录,包括试验中产生的各种原始记录和试验结果的处理报告和结论意见。
3 指数寿命型统计试验方案
3.1 定数截尾鉴定试验
定数截尾试验预先规定出现r个故障时截止试验,此时累积试验时间为T,则MTBF的观测值为:
*
T*/r,当订购方给出置信水平1(订购方风险),观测值的单侧置信下限(系数)为:
2r2T*
L22
(2r)(2r)
双侧置信区间(系数)为
2r2T*
L22
(1)/2(2r)(1)/2(2r)
U
2T*
22
(1)/2(2r)(1)/2(2r)
2r
经过计算转换,编制了定数截尾置信水平系数表,直接可以查出,此时:
MTBF单侧置信下限为L'L(,r) MTBF的双侧置信区间为
L'L(1,r) U
2
1'
U(,r)
2
试验数据处理程序为:
*
1) 计算出现定数故障数r时刻的累积试验时间T;
2) 计算MTBF的观测值T*/r;
3) 计算置信水平1,并在查出系数后计算MTBF单侧置信下限 L'L(,r)
4) 与规定的MTBF比较,L'L(,r)MTBF时,通过鉴定; 5) 计算MTBF的置信区间,置信水平12;
6) 将置信上限与MTBF规定值进行比较,如果前者小于后者,说明MTBF在不可接收的区间,其错判概率为β。
*
定时截尾试验预先规定累积试验时间为T结束试验,期间出现r个关联故障,此时则MTBF的观测值为:T*/r;如果期间未测到故障(r=0),IEC建议MTBF的观测值为3 T。当订购方给出置信水平1(订购方风险),观测值的单侧置信下限(系数)为:
*
L
双侧置信区间(系数)为
2r2T*
22
(2r2)(2r2)
L
2r2T*
22
(1)/2(2r2)(1)/2(2r2)
U
2T*
22
(1)/2(2r)(1)/2(2r)
2r
经过计算转换,编制了定时截尾置信水平系数表,直接可以查出,此时:MTBF单侧置信下限
为 LL(,r)
MTBF的双侧置信区间为
LL(1,r) U
2
1
U(,r)
2
试验数据处理程序为:
*
1) 计算累积试验时间T及试验发生的关联故障数r;
2) 计算MTBF的观测值T*/r;
3) 计算置信水平1,并在查出系数后计算MTBF单侧置信下限 LL(,r)
4) 与规定的MTBF比较,当LL(,r)MTBF时,通过鉴定; 5) 计算MTBF的置信区间,置信水平12;
6) 将置信上限与MTBF规定值进行比较,如果前者小于后者,说明MTBF在不可接收的区间,其错判概率为β。
3.3 定时截尾试验标准方案
根据标准,定时截尾试验方案参数包括:生产方风险α和订购方风险β、MTBF可接收值θ0和最低可接收值θ1、鉴别比d0/1、以θ1归一化的试验时间、判决故障数(接收数和拒收数,后者为前者加1)。由于试验耗费资源较多,双方如果希望缩短试验时间,可采取短时高风险方案。 选定定时截尾试验方案的程序:
1) 根据产品可靠性水平和用户要求研讨θ0和 θ1,综合试验时间和所需资源权衡确定θ1、d、α、β等参数;
2) 根据 θ1、d、α、β等参数,查表得到相应的试验时间、接收判决的故障数及拒收故障数;
3) 权衡的原则
降低决策风险,则需要延长试验时间,判决故障数也相应增加,带来的问题是试验费用增加、试验周期长;
相反,提高决策风险,可以缩短试验时间,判决故障数减少,试验费用和时间周期减少。 应根据产品可靠性水平和要求适当选择,较多单位趋于方案17。 3.4 序贯试验方案
序贯试验的试验时间不能预先确定,必须在试验过程应用公式进行计算,给管理上带来不便。为解决此问题,标准将各方案的判决时间与故障数的对应关系列出,试验过程不断应用即可。
序贯试验同样分为标准型和高风险型两类方案,试验大纲规定采用序贯试验方案时,有关方面应根据产品的可靠性水平选定。程序如下。
1) 生产方和订购方协商确定θ0、θ1,α、β;d=θ0/θ1取1.5、2.0、3.0之一,α、β取10%、20%或30%之一。
2) 查表,得试验方案号及其相应的判决时间表,将表中对应的时间与θ1相乘得到判决的累积试验时间(小时)TAc(接收)TRe(拒收)。
3) 进行试验,验收试验的样品量建议为批量的10%,最多不超过20台。试验中应及时计算累积试验时间和记录的故障数r,并比较判决:
当r对应的累积试验时间T TAc,判决为接收,停止试验;
当r对应的累积试验时间T TRe,判决为拒收,也停止试验;
当TRe T TAc,继续试验,到下一个故障数再比较判决,直至作出结论为止。
4 全数试验
如果订购方要求对每一台产品都进行可靠性试验,而不采用抽样试验方案,就是全数试验。 标准根据序贯试验原理,给出了全数试验的判决时间表。
有一些家用电器产品,其工作环境条件与生产厂最后考机的试验条件接近,如果把该工艺过程看成是可靠性验收试验,则属于全数试验的类型。如果根据上表进行判决也是可行的。
例如,某一型号的彩电,其最低可接收MTBF为15000小时,即为θ1,如选定关联失效数为0,则必须超过累积4.40×15000=66000小时的试验时间不出故障,方可判决为接收。如果每台机在线上考机2小时,则至少连续33000台机不出现故障。
第五章 可靠性保证试验
1 概述
1.1 环境应力筛选的无故障检验试验 1.1.1 试验目的与判据
前已说明,在GJB 1032《电子产品环境应力筛选方法》中规定,在环境应力筛选的后期程序中要安排无故障检验试验。其目的是验证筛选的有效性。其方法是先进行80小时的温度循环,后进行最长15分钟的随机振动,所用应力参数与前面缺陷剔除程序的相同。
无故障检验试验的判据是:在80小时温度循环中如果有连续40小时无故障、在最长15分钟随机振动中如果有连续5分钟无故障,就认为产品通过了环境应力筛选,否则要继续进行缺陷剔除筛选,之后再进行无故障检验试验。 1.1.2 无故障检验试验的概念与发展
无故障检验试验作为环境应力筛选效果的验证试验,要验证产品是否达到了筛选方案中预期要剔除的缺陷百分值,也是衡量产品是否已经消除早期失效并进入随机失效期。随机失效期的失效率正是装备可靠性水平的标志。因此,无故障验证试验的最终目的是验证产品是否达到了设计的可靠性要求值。如果无故障检验试验通过了,我们就有理由认为产品达到了定量环境应力筛选方案所预期的要消除缺陷的高百分值(例如98%),也就是说产品以该百分值的置信水平达到了可靠性设计值。从这个含义出发,我们可以用这种试验来证明产品是否实现了设计的MTBF值,其置信概率可与环境应力筛选方案要求的相同。这就是由环境应力筛选发展而来的可靠性保证试验的出发点。
1.2 可靠性保证试验的性质与用途 1.2.1 可靠性保证试验的性质
可靠性保证试验以无失效的试验时间来验证设备的MTBF值,是环境应力筛选工作的外延和发展,其性质仍属工程试验的范畴。 1.2.2 可靠性保证试验的应用
如前所述,通过MTBF保证试验的产品,被认为消除了高百分比的缺陷型早期失效和达到了设计的MTBF值。因此可靠性保证试验可用于推断产品的MTBF值。可为承制单位评估产品的MTBF值提供工程依据。
2 试验参数的确定
2.1 试验参数的定义
在制定可靠性保证试验方案时,必须使用以下参数,各自的定义为: =设备通过无缺陷失效试验的概率; T(r)=MTBF保证试验时间; T(W)=最佳试验时间; M=设备的MTBF设计值。
2.2 试验时间的确定
可靠性保证试验的试验时间与上述参数有关,由以下关系式计算求解。
[(M1)T(r)(MT(W)T(r)]/M[T(r)1] (5-2-1) 式中:T(W)/T(r)值需要综合考虑,其原则是:
当T(W)/T(r)<2时,通过试验的概率下降较多;当T(W)/T(r)>2时,试验时间将加长,耗费较大;因此选取T(W)/T(r)=2是最佳的。 保证试验时间T(r)求解过程如下:
将T(W)/T(r)=2,即T(W)2T(r)代入上式,并令产品通过无缺陷失效试验概率=0.98(高概率),可解得:
T(r)=0.212M (5-2-2) 由此可知,可靠性保证试验所需的时间是很少的。
2.3 可靠性保证试验与环境应力筛选无故障验证试验的同异
环境应力筛选无故障检验试验与可靠性保证试验都是在环境应力筛选剔除了早期失效之后的工作,都可以检验环境应力筛选工作是否达到了预期的目的,在试验中如果发生故障都可在排除之后继续试验。这是它们的相同之处。
在试验时间上,环境应力筛选的无故障检验试验一般只要连续40小时不发生故障,试验就可以结束,环境应力筛选工作判为通过;而可靠性保证试验需要有连续T(r)小时不发生故障,试验才可结束,总试验时间取决于产品的MTBF值,一般要比前者稍长。
2.4 试验时间计算示例
设某雷达的可靠性指标要求为150小时,设计的MTBF值比指标略有裕量,在环境应力筛选方案中要求以0.98的高概率通过MTBF保证试验,试求对其进行可靠性保证试验的时间( 即连续不发生失效的工作时间)。
解:由T(r)=0.212M式,有: T(r)=0.212×150=31.8小时。
取整为33小时,比环境应力筛选无故障检验试验时间还少。
需要说明,上述关系式是在通过概率α=0.98的特定条件下的求解试验时间式,有一定的局限性。为了便于可靠性工程的应用,有的资料给出了α、M和T(r)三者的关系曲线图,可以快速查出不同的α和M对应的T(r)值。
2.5 试验剖面的确定
可靠性保证试验是在环境应力筛选的基础上进行的,由此试验剖面可以是环境应力筛选的温度循环应力,也可以用任务剖面。为了方便起见,一般采用前者。具体剖面的确定方法,可参考本教材第二章《环境应力筛选》有关内容。
3 试验方案
可靠性保证试验是环境应力筛选工作的延续,试验方案与之衔接得十分紧密,一般可在环境应力筛选方案之上补充此部分内容即可。试验实施中的所有要求都和环境应力筛选的要求一样。但是,必须注意以下问题:
a) 可靠性保证试验对承制方评估(推断)产品的MTBF值可能是十分经济有效的。但它不能取代可靠性鉴定或验收试验。
b) 从试验时间来看,可靠性保证试验要比老炼时间长,对大批量产品而言,它只适用于样本;对数量少的产品(如大型设备或大系统)来说,可适用于全部产品。
c) 如果在可靠性保证试验时间内发生了故障,必须进行分析,一旦发生缺陷型失效,必须中断试验;此时要检查环境应力筛选的效果,待补做环境应力筛选并确认所有缺陷都消除之后,再重做可靠性保证试验,直至通过为止,这样试验目的才能达到。
d) 对大多数电子设备而言,此项试验连同环境应力筛选一起所需试验时间在 100~150小时之间,远比可靠性鉴定或验收试验(统计试验)所需的时间短,承制方用可靠性保证试验的方法对产品进行自我可靠性评价,是很经济的。
4 实例
4.1 基本情况
1991~1992年五所工程中心对某厂生产的3部军用短波自适应电台进行了环境应力筛选和可靠性保证试验。环境应力筛选的情况已在本书第二章介绍。在环境应力筛选之后接着进行了123小时的可靠性保证试验,推断出该电台的可靠性定量值,取得了良好的效果。 4.2 试验方案
4.2.1 可靠性保证试验剖面的确定
本试验是接续环境应力筛选工作进行的,因此就采用环境应力筛选的高低温循环和随机振动两种应力组合。 a) 温度应力
温度变化范围:+60℃、-40℃;
温度变化率:+7℃/min、-11℃/min;
高、低温停留时间:1.5小时,一个循环用时3.5小时。 b) 随机振动应力
频率范围:20~2000Hz;
2
功率谱密度:0.04g/Hz(80~350Hz);
频率高低端功率谱密度变化率:±3dB/倍频程。 4.2.2 试验时间计算
已知条件:电台设计要求的MTBF=500小时;
按照式(5-2-1),令接收概率α=0.98(高概率),可以直接引用式(5-2-2),即保证试验的观察窗口时间:
T(r)=0.212M=0.212×500=106小时。 取32个循环。 4.2.3 应力施加程序
在完成40小时(随机振动和12个温度循环)的环境应力筛选后,接着安排可靠性保证试验,其程序是:
15min的随机振动(进行5分钟未发生故障即停止振动试验)接着进行 32个温度循环。 说明:由于可靠性保证试验与环境应力筛选的无故障检测验收试验合并进行,由此没有在连
续有40小时不发生故障时停止试验,而是按照可靠性保证试验的方案做完32个温度循环。 4.2.3 试验结果
3部电台累计试验368小时(含随机振动和温度循环),连续无故障。 4.2.4 数据处理与跟踪结果
对试验数据进行简单处理,可获得该电台MTBF的推断值在868小时以上。由此可知,比指标值500小时提高了70%多。
根据近两年的跟踪调查结果表明,该电台的现场使用MTBF值已远远超过500小时, 体现了环境应力筛选和可靠性保证试验获得的效益。