为帮助大家系统构建可靠性工程的知识体系,我们将启动系列专题文章。首期以杨广斌博士《产品生命周期可靠性工程》为主线,详解全流程可靠性框架。后续将深入FMEA、寿命数据分析、加速试验、FTA、DOE等核心专题。敬请关注。
上一篇留了个尾巴:三步法【规划→嵌入→设计→验证】到底怎么落地?
光有方法论不够,你得知道在哪个节点做什么事。否则"嵌入"就是一句空话——可靠性工程师进不了设计评审会,只能在试验室里等着"测一测",然后被叫去"评审一下"。
这篇文章,把产品生命周期拆开来,一个阶段一个阶段说清楚:每个阶段的可靠性任务是什么、谁来做、怎么做。
杨博士在书里把产品生命周期分成六个阶段:
产品规划 → 设计与开发 → 验证与确认 → 生产 → 现场交付 → 处置(报废)
这个分法看起来常规,但背后的逻辑值得深究:可靠性工作能不能做好,取决于它在哪个阶段介入。
大多数企业的可靠性工作从"设计阶段"才开始。实际上,真正的起点是产品规划。
规划阶段做什么?
这个阶段定下来的东西,后面的设计、验证、生产都要跟着走。
杨博士说:规划阶段做出的决策,对整个产品生命周期的影响是"tremendous"(巨大的)。
举个反面例子: 某车企规划一款电动车,定的目标竞争对手是"续航500公里",但没有深入分析目标市场客户的实际使用场景。结果呢?开发阶段发现要达到续航目标,电池成本根本扛不住。怎么办?降规格。降完规格,客户的期望已经吊起来了,实际产品却缩水了。这就是规划阶段埋的雷。
可靠性在规划阶段的任务:定目标。 这款产品要达到什么样的可靠性水平?目标客户是谁?使用场景是什么?保修期多长?这些定了,后面的设计才有方向。
这是最关键的一个阶段,也是大多数企业做得最差的一个阶段。
为什么说最差?因为这个阶段"设计阶段的工作量只占整个产品开发周期的5%,但它决定了50%以上的成本"。
5%的投入,50%以上的影响。这个账,会算的企业不多,算得明白的就更少。
设计与开发阶段分两步:
解决"用什么结构实现功能"的问题。这一步定了,整个产品的可靠性框架就定了——能选冗余设计还是单点失效?能选成熟工艺还是新技术?这些问题在概念设计阶段定了,后面改不了。
解决"每个零件的参数怎么定"的问题。材料选什么?公差放多少?供应商用谁?这步做得细,后面的问题就少。
> 我见过太多企业,概念设计阶段走过场,详细设计阶段拍脑袋。等产品做出来了,发现"哎,这个零件怎么总坏"——根子都在前面。
可靠性在设计阶段的任务:嵌入。 把可靠性要求变成设计参数、工艺约束、供应链标准,从第一天就在设计里,而不是"设计完了找可靠性工程师审一审"。
设计做完了,接下来要证明"设计达到了目标"。
这个阶段分两步:
用少量样机证明设计满足要求。测什么?功能、环境、可靠性、法规。
测出来了,没达标——改设计,不是改测试条件。
用小批量生产证明"生产过程能造出符合要求的产品"。关键在于:样机和量产产品用的是同样的材料、同样的工艺、同样的测试手段。如果不一样,PV就失去了意义。
> 很多企业的验证阶段走过场,原因就一个:赶工期。产品还没验证完,市场部门已经开始催着量产了。结果呢?"验证通过"的产品,到了客户端问题一堆。
杨博士有句话很扎心:"In general, cost to fix a design increases an order of magnitude with each subsequent phase."
每往后一个阶段,修复设计的代价涨10倍。
产品实现过程的最后一个环节,也是很多企业"可靠性工作最薄弱的环节"。
原因很简单:前面的设计、验证都做完了,到了生产阶段,管理层觉得"该做的都做了,剩下的就是制造的事"。
实际上,生产阶段有两大任务:
通过过程控制计划、SPC图表,监控生产过程的稳定性。一旦出现异常,立即识别和纠正。这叫"防火"。
通过环境应力筛选(ESS)等手段,把有潜在缺陷的产品在出厂前挑出来。这叫"排雷"。
很多企业的生产阶段只有"排雷",没有"防火"。SPC做了,但没人看;异常发现了,但没人改。结果呢?筛选筛掉一批货出去,到客户端还是有问题的产品。
产品交给客户了,可靠性工作并没有结束。
现场阶段的任务:监控、分析、改进。
保修数据(现场数据)。客户报修了、失效了,这些数据是活的。
失效趋势、失效模式、失效根因。
识别出主要失效模式后,通过六西格玛等项目,从根上解决。
> 杨博士说:"Field failure monitoring and analysis are critical to the continuous improvement of product reliability."
> 现场失效监控和分析是产品可靠性持续改进的关键。
很多企业把"客服"当成"售后",从来没当成"学习机会"。保修数据躺在系统里,没人分析;同一类失效重复出现,每次都是"个案处理"。这是对数据的浪费。
最后一个阶段,也是很多企业完全忽略的阶段。
处置阶段做什么?产品报废、拆解、回收。
这个阶段和可靠性有什么关系?
关系大了:拆解产品的失效件,是获取可靠性数据最直接的方式。 故障件里藏着产品最真实的失效模式,比任何加速试验都准。
很多车企有"失效件分析"机制,但大多数中小制造企业没有。等产品报废了,失效件直接进了废品站,几年积累下来的失效数据全部流失。
回顾一下第一篇讲的"三步法":规划→嵌入→验证。
六个阶段和三步法的对应关系:
| 三步法 | 产品生命周期阶段 |
|---|---|
| 规划 | 产品规划阶段 → 定目标、定方向 |
| 嵌入 | 设计与开发阶段 → 把可靠性做进设计里 |
| 验证 | 验证与确认阶段 → 证明设计达到目标 |
| — | 生产阶段 → 保持可靠性+筛选不合格品 |
| — | 现场交付阶段 → 监控+分析+改进 |
| — | 处置阶段 → 失效件分析+数据回收 |
"三步法"解决的是"产品实现过程"的可靠性问题。但完整的生命周期可靠性工程,还要覆盖生产、现场交付和处置三个阶段。
大多数企业的可靠性工作,只做了"验证"这一块——测了HALT试验、做了环境应力筛选、出了可靠性报告。然后呢?客户端该坏的还是坏。
原因很简单: 验证是事后诸葛亮,设计嵌入才是根本。
嵌入在哪个阶段?设计和开发。设计阶段的工作量只占5%,但决定了50%以上的成本。这一步没做好,后面全是修修补补。
下一篇文章,我们接着聊:可靠性工作如何融入产品研发流程。
本文基于《产品生命周期可靠性工程》(Guangbin Yang, Wiley, 2006)整理。
工业和信息化部电子第五研究所解江主任在2026可靠性研讨会上的精彩演讲。从折叠屏手机FPC断裂、新能源汽车MOS管热烧毁等真实案例出发,探讨如何用"察微溯源、破相立本"的第一性原理思维解决可靠性工程难题。
网安加学院院长宋荆汉在2026可靠性应用&液冷技术研讨会上发表演讲,深度剖析AI时代传统软件可靠性保障体系面临的根本性冲击,提出"前验约束"新范式,阐述可靠性四可控原则与新三大支柱。
深入剖析"测试通过"与"真正可靠"之间的差距,揭示型式试验的三大局限:温度范围受限、时间尺度受限、工况简化受限。通过工业阀门真实案例(售后失效率15%→0.5%)展示FMEA如何成为测试方案的导航仪。
专业团队提供一对一解答,定制适合您的解决方案