
引言
SPC(Statistical Process Control,统计过程控制)是用统计学方法来监控和控制制造过程的工具。它的核心理念源自一个简单的事实:任何制造过程都存在变差(Variation),关键是区分"正常变差"和"异常变差"。
在 APQP 体系中,SPC 主要应用于第四阶段(产品和过程确认)和第五阶段(持续改进),帮助回答一个关键问题:我的过程是否稳定?过程能力是否满足要求?
本文将从变差的概念出发,介绍控制图的原理和使用方法,以及 Cp/Cpk/Pp/Ppk 等过程能力指数的计算与判读。
理解变差
两类变差
SPC 将过程中的变差分为两类:
普通原因变差(Common Cause Variation)
- 过程固有的、随机的、可预测的波动
- 来源广泛且每个来源的影响都很小
- 例如:环境温度的微小波动、材料批次间的微小差异、设备的正常磨损
- 特征:过程在统计控制状态下,输出呈正态分布
特殊原因变差(Special Cause Variation)
- 非随机的、可识别的、异常的波动
- 通常来源于某个具体的可查明原因
- 例如:刀具突然崩刃、新操作员未经培训上岗、原材料批次异常
- 特征:过程输出的分布发生偏移或形状改变
为什么区分很重要
对待两种变差的策略完全不同:
- 普通原因:只能通过改变系统(改进设备、优化工艺、升级材料)来减少,个人层面的干预通常无效甚至有害
- 特殊原因:需要立即识别并消除根因,防止再次发生
如果把普通原因当成特殊原因来处理(过度调整),反而会增加变差——这就是统计学中著名的"过程篡改"(Tampering)。
控制图基础
控制图是 SPC 最核心的工具,由休哈特(Walter Shewhart)在 1920 年代发明。
控制图的结构
一个标准的控制图包含三条线:
- UCL(上控制限):中心线 + 3σ
- CL(中心线):过程均值
- LCL(下控制限):中心线 - 3σ
将样本数据按时间顺序描点在图上,观察数据点是否在控制限内且无异常模式。
控制限 ≠ 规格限。控制限是根据过程数据计算出来的,反映过程的实际表现;规格限是客户要求,反映产品应该达到的标准。两者是独立的。
常用控制图类型
| 控制图 | 数据类型 | 适用场景 |
|---|---|---|
| X̄-R 图 | 计量型(子组 n ≤ 8) | 最常用,监控均值和极差 |
| X̄-S 图 | 计量型(子组 n > 8) | 大样本时用标准差代替极差 |
| X-MR 图 | 计量型(单值) | 破坏性检测或批量小时 |
| p 图 | 计数型(不合格品率) | 样本量可变 |
| np 图 | 计数型(不合格品数) | 样本量固定 |
| c 图 | 计数型(缺陷数) | 检验单位固定 |
| u 图 | 计数型(单位缺陷数) | 检验单位可变 |
X̄-R 控制图的建立步骤
以最常用的 X̄-R 图为例:
第一步:收集数据
收集至少 25 个子组(Subgroup),每个子组 3-5 个样本。
第二步:计算每个子组的均值和极差
- X̄ᵢ = 子组内样本的平均值
- Rᵢ = 子组内最大值 - 最小值
第三步:计算总体均值和平均极差
- X̿ = 所有 X̄ᵢ 的平均值(中心线)
- R̄ = 所有 Rᵢ 的平均值
第四步:计算控制限
X̄ 图的控制限:
- UCL = X̿ + A₂ × R̄
- LCL = X̿ - A₂ × R̄
R 图的控制限:
- UCL = D₄ × R̄
- LCL = D₃ × R̄
其中 A₂、D₃、D₄ 是与子组大小 n 相关的系数:
| n | A₂ | D₃ | D₄ |
|---|---|---|---|
| 2 | 1.880 | 0 | 3.267 |
| 3 | 1.023 | 0 | 2.574 |
| 4 | 0.729 | 0 | 2.282 |
| 5 | 0.577 | 0 | 2.114 |
第五步:描点并分析
将数据点描在图上,检查是否有失控信号。
控制图的判读规则
一个过程被判定为"失控"(Out of Control),通常基于以下规则(参考 Nelson 规则或 Western Electric 规则):
规则 1:超出控制限
任何一个点落在 UCL 或 LCL 之外。
规则 2:连续 9 点在中心线同侧
连续 9 个(或更多)数据点都在中心线的上方或下方,说明过程均值可能发生了偏移。
规则 3:连续 6 点递增或递减
连续 6 个点呈单调上升或下降趋势,说明过程可能存在系统性漂移(如刀具磨损)。
规则 4:交替出现
连续 14 个点交替上下波动(锯齿形),说明可能存在两个不同的过程混合(如两台设备交替使用)。
规则 5:2/3 的点在 ±2σ 外
连续 3 个点中有 2 个点落在 ±2σ 到 ±3σ 的区域内,说明变差可能在增大。
发现失控信号后,应立即调查原因、采取纠正措施,并在控制图上标注异常原因和处理结果。
过程能力指数
过程稳定后,需要评估过程是否有能力满足规格要求。这就是过程能力分析。
Cp 和 Cpk
Cp(过程能力指数):衡量过程的"潜力",不考虑过程中心是否偏移。
Cp = (USL - LSL) / (6σ)
Cpk(过程能力指数,考虑偏移):衡量过程的"实际表现"。
Cpk = min[(USL - X̿) / (3σ), (X̿ - LSL) / (3σ)]
- Cp = Cpk 时,说明过程中心与规格中心完全重合
- Cp > Cpk 时,说明过程中心有偏移,偏移越大 Cpk 越小
Pp 和 Ppk
Pp/Ppk 与 Cp/Cpk 的公式完全相同,区别在于标准差的计算方式:
| 指标 | 标准差来源 | 适用阶段 |
|---|---|---|
| Cp/Cpk | 组内标准差(R̄/d₂) | 过程稳定后(长期) |
| Pp/Ppk | 总体标准差(所有数据) | 初始研究阶段(短期) |
在 PPAP 提交中,通常要求 Ppk ≥ 1.67(初始过程研究),量产稳定后要求 Cpk ≥ 1.33。
能力指数的判读
| Cpk 值 | 过程状态 | 建议 |
|---|---|---|
| ≥ 2.0 | 优秀 | 可以考虑减少检验频率 |
| 1.67 - 2.0 | 良好 | 继续监控 |
| 1.33 - 1.67 | 可接受 | 需关注并持续改进 |
| 1.0 - 1.33 | 勉强 | 需要改进,加强检验 |
| < 1.0 | 不足 | 过程不满足要求,必须改进 |
一个直观的理解
Cpk = 1.0 意味着过程输出刚好占满规格范围的 ±3σ,此时不合格品率约为 0.27%(2700 PPM)。
Cpk = 1.33 意味着过程范围只占规格范围的 75%,不合格品率降到约 63 PPM。
Cpk = 1.67 意味着过程范围只占规格范围的 60%,不合格品率降到约 0.6 PPM。
常见误区
误区一:只看 Cpk 不看控制图
Cpk 只是一个统计量,它假设数据服从正态分布且过程稳定。如果过程不稳定(控制图有失控信号),计算出来的 Cpk 没有意义。
正确做法:先用控制图确认过程稳定,再计算过程能力。
误区二:混淆控制限和规格限
- 控制限来自过程数据,反映过程的自然变差范围
- 规格限来自客户要求,反映产品应达到的标准
一个过程可能在控制状态(所有点在控制限内),但过程能力不足(Cpk < 1.33)。也可能过程能力充足但出现失控信号。两者要分别评估。
误区三:过度调整
操作员看到某个点接近控制限就去调整设备,这种"过度反应"反而会引入额外的变差。SPC 的原则是:只有出现失控信号时才需要调查和干预,正常波动不要动。
误区四:数据量不足
用 5 个子组就算 Cpk,结果毫无意义。过程能力研究至少需要 25 个子组、总计 100 个以上的数据点。
SPC 在 APQP 中的位置
| APQP 阶段 | SPC 的作用 |
|---|---|
| 第三阶段 | 制定 SPC 实施计划,确定需要监控的特性 |
| 第四阶段 | 试生产时进行初始过程能力研究(Ppk),纳入 PPAP |
| 第五阶段 | 量产中持续使用控制图监控过程,计算长期 Cpk |
总结
SPC 的核心逻辑可以总结为三步:
- 用控制图区分普通原因和特殊原因——判断过程是否稳定
- 消除特殊原因——让过程回到统计控制状态
- 评估过程能力——判断过程是否满足规格要求
SPC 不是一个复杂的数学工具,它的难点在于正确地理解和应用。最常见的失败不是算错了 Cpk,而是在过程不稳定时就去算 Cpk,或者收集了数据却不去分析和行动。
数据本身不创造价值,基于数据做出正确的决策才有价值。这是 SPC 最重要的一课。

