可靠性文章

【连载01】为什么你的产品总在不该坏的时候坏?

小可 / 国可工软2026-03-31~10 分钟
# 可靠性工程# 浴盆曲线# 成本规律# 杨广斌# 设计阶段# FMEA# 连载

先讲个真实的故事

某款电机在实验室里跑了两年,什么问题没有。量产之后,客户端陆续出现轴承异响。一查才发现:设计阶段选的轴承型号,供应商悄悄换了材料,新旧两款的游隙差了0.02毫米。

0.02毫米,放到图纸上谁都不会注意。但装机之后,振动、温升、寿命全部受影响。等客户端批量投诉,召回国、换零件,代价是设计阶段改方案的几十倍。

这不是孤例。这是制造业里最常见的死法:问题出在设计阶段,症状显现在客户端。


01 发现越晚,代价越大

杨博士在这本书里说了一句大实话:产品失效不可避免,但失效的代价,取决于你什么时候发现它。

具体差多少?大致是这样一个数量级的规律:

  • 设计阶段发现缺陷:成本 = 1
  • 制造阶段发现缺陷:成本 = 10
  • 客户使用阶段发现缺陷:成本 = 100~1000

每晚一个阶段,修改代价涨10倍。这是可靠性领域被反复验证的铁律,不是什么理论推演,是福特汽车、通用汽车这些车企几代人用真金白银砸出来的经验。

为什么差距这么大?

设计阶段改个参数,图纸更新就行。制造阶段发现问题,要停线、返工、改工艺。最惨的是客户已经拿到产品了——召回国、换零件,商誉损失,处理一件问题的成本能买几十台新设备。

但很多企业干的事,恰好是这个顺序的反面:前期省可靠性投入,后期靠测试和售后兜底。结果年年做测试、月月修故障,可靠性还是上不去——因为一直在下游救火,不在上游防火。

可靠性成本规律

02 失效不是随机的,它有规律

产品失效遵循一条被称为"浴盆曲线"的规律。

说白了就三件事:

① 刚出厂的时候毛病最多,各种虚焊、螺丝松、材料内伤,熬过去就消停了;

② 中间那段是黄金期,基本不坏;

③ 老了以后又开始出问题,材料疲劳、零件老化,该来的都会来。

你的产品"在不该坏的时候坏",要么是头没开好,要么是中间混进了次品,要么是设计的时候余量没给够。知道了规律,应对就有方向了。


03 这本书的作者是谁

《Life Cycle Reliability Engineering》的作者杨广斌博士(Guangbin Yang),他在韦恩州立大学(Wayne State University, Detroit)获得工业工程硕士与博士学位。杨博士长期深耕于汽车工业一线,是典型的"工业界专家型"学者。

  • 在福特汽车:他曾担任首席可靠性工程师,负责整个产品生命周期中的可靠性保证工作。
  • 后克莱斯勒:担任技术研究员(Technical Fellow)。在克莱斯勒的技术职级体系中,Technical Fellow是技术人员的最高荣誉,代表他在可靠性工程领域的权威地位。

本书是他在福特汽车工作期间编写。福特的可靠性体系在全球汽车行业是出了名的严苛,这本书也是他从Ford实际项目中总结出来的方法论,不是闭门造车者的空谈。

杨广斌博士

这本书2006年由Wiley出版,覆盖从产品规划到保修分析的全生命周期可靠性技术。翻译过来就是机械工业出版社的《产品生命周期可靠性工程》。

和市面上其他可靠性书籍相比,这本书有三个不一样的地方:

一是从设计端出发,不是从测试端出发。

杨博士在前言里说得很清楚:制造和售后解决的问题,都是设计阶段埋下的根。测试只是发现手段,设计才是解决根本。

二是强调实用,不是理论堆砌。

书里每个方法都有真实工业案例支撑,Ford、GM干过的项目,该踩的坑、该绕的弯路,都写进去了。

三是把可靠性和成本挂钩。

不是讲"怎么做可靠",而是讲"怎么做可靠划得来"——这对做产品决策的人尤其重要。


04 这个系列会讲什么

我们计划发布25篇文章介绍该书,后面24篇,我们会沿着产品生命周期的脉络,把这本书拆开讲。

有几篇我提前说一下为什么值得跟——

第2篇讲可靠性的定义。三个词:"规定功能、规定时间、规定条件"。听起来简单,但我见过太多企业在这三个词上翻车。比如"规定条件"没写清楚,实验室里跑得好好的,拉到西北风沙地区直接趴窝。你觉得这是产品的问题,还是定义的问题?

第20篇讲FMEA——这个工具在国内被用烂了,但真正用对的没几个。我会拿几个真实翻车案例说,FMEA做得再漂亮,也可能是集体自我安慰。

第22篇讲二维保修分析。这个在别的可靠性书里很少单独讲,但杨博士在这本书里给了很完整的框架——为什么里程和时间都要考虑,怎么算才不会亏。

剩下的20篇,覆盖寿命分布、可靠性分配、串并联系统、加速寿命试验、故障树分析……这些是定量可靠性的核心工具,不懂它们,可靠性工作永远停在"定性判断"层面。


05 你现在卡在哪个阶段?

大多数企业的可靠性工作现状:

还停留在"靠测试发现问题、靠售后倒逼改进"这个阶段。

体系问题:

  • 规划阶段没有可靠性工程师介入
  • 设计阶段没有可靠性约束嵌入
  • 试验方案靠经验拍脑袋
  • 生产阶段过程控制形同虚设
  • 售后数据躺在系统里没人分析

> 作者反思: 我见过的企业,十个里有八个卡在这一层。你们公司呢?


下篇预告

【连载02】可靠性工程不是测试,是一门设计哲学

相关文章

可靠性文章

第一性原理在可靠性工程中的应用

工业和信息化部电子第五研究所解江主任在2026可靠性研讨会上的精彩演讲。从折叠屏手机FPC断裂、新能源汽车MOS管热烧毁等真实案例出发,探讨如何用"察微溯源、破相立本"的第一性原理思维解决可靠性工程难题。

可靠性文章

Vibe Coding时代软件可靠性基石的重构

网安加学院院长宋荆汉在2026可靠性应用&液冷技术研讨会上发表演讲,深度剖析AI时代传统软件可靠性保障体系面临的根本性冲击,提出"前验约束"新范式,阐述可靠性四可控原则与新三大支柱。

可靠性文章

为什么你的产品通过了所有测试,却还是在客户那里坏了?

深入剖析"测试通过"与"真正可靠"之间的差距,揭示型式试验的三大局限:温度范围受限、时间尺度受限、工况简化受限。通过工业阀门真实案例(售后失效率15%→0.5%)展示FMEA如何成为测试方案的导航仪。

想了解更多或申请软件试用?

专业团队提供一对一解答,定制适合您的解决方案