Cpk和Ppk最常见的定义是:Cpk是过程的短期能力,Ppk是长期能力。事实上,这些统计指标远不止这些,了解过程和能力统计的真正含义非常重要。然而,为了揭示流程的真实状态,必须对数据进行准确的评估和解释。
为什么要进行过程能力研究?有三个原因
1、在特定时间点评估流程的潜在能力
为了获得规范内的值,
2、预测流程的未来潜力,以便在
使用有意义的指标的规范,以及
3、通过减少或可能减少
消除可变性来源。
根据马克·吐温自己的自传,1906年《北美评论》中的章节说到统计,“有三种谎言:谎言、该死的谎言和统计。”
统计数据可以成为在无数数据中辨别真相的有力工具,如果使用得当并加以适当解释,它们将是无价的。但巨大的危险来自于将信心放在一个没有正确应用和解释的统计数据中。因此,验证Cpk和Ppk过程统计数据必须满足哪些条件?
要使过程能力和性能统计数据成为有意义的指标,必须满足四个条件:
1、样品必须真正代表工艺。这包括6个M:人、机器、材料、测量、方法和自然母亲(环境)。
2、质量特性的分布必须是高斯分布,即数据可以正态分布在概率曲线上。如果数据不一致,问题是:它能被规范化吗?各种分析方法被用来潜在地规范化数据或应用非参数分析——这些高级技术将在未来的文章中解释。
3、过程必须进行统计控制。换句话说,它是否稳定,其变化是否通常是随机的(共同原因)?注:实时控制图应在捕获过程能力数据时验证统计稳定性。不要等到数据被提取出来后才创建控制图,只会发现过程在过程中失去了统计控制,或者存在其他可识别的问题。
4、样本必须足够大,以建立预测能力模型。样本量有多大?这是个错误的问题。记住,一个统计数据,如果应用得当,只是对真理的估计。正确的问题是:我需要对估计有多大的信心?如果观察到Cpk为1.70,我们应该报告,“我不知道真实的Cpk,但基于n=30点的随机样本,
我有95%的信心,根据置信区间,它介于1.23和2.16之间。”另一方面,对于相同的数据集,n=500点,我可以说:“我有95%的信心,根据置信区间,Cpk在1.19到1.37之间。”为了获得Cpk的可靠估计值,尤其是对于初始生产中没有已知历史标准偏差的新工艺或零件,需要
可能需要谨慎地要求(n=100)测量以进行能力分析。请参见图1和图2以了解所描述的内容。


简略图表基于从正态分布曲线随机生成的100000个数据点。规格限值为10.0+/-0.05 mm。在本例中,图表显示,如果只有28个样本,则Cpk的估计值为(Cpk+/-0.50)。因此,如果我们的Cpk为1.25,则置信区间预测实际Cpk为(0.75至1.75)。将曲线取出2000个样本,Cpk估计值为+/-0.1,10000 Cpk估计值为+/-0.04。简单地说:样本量很重要。此外,随着数据点数量的增加,Cpk接近Ppk。
那么Cpk和Ppk到底是什么呢?
Cpk是流程在特定时间点的快照或一系列快照,用于评估流程的“本地和及时”能力。可以将Cpk更多地看作是对未来更大的流程数据群体的洞察点。
Cpk由作为有理子组生成的测量值组成。子组是表示流程快照的一系列度量。最好同时以同样的方式以可控的方式拍摄。例如,齿轮轴是在连续过程中制造的。每小时制造100个零件,并在能力研究中评估临界直径。每小时将对10个轴进行取样,持续6小时。这意味着我们将有六个分组,每组10个轴测量值,一天总共60个测量值。(图3)

60个数据点或1/10的过程能力指标th公司将使用轴测量的子组内变化计算每日输出的。它不会解释子组之间的任何漂移或移位。这种区别对于理解Cpk和Ppk之间的差异至关重要。
Ppk将指示潜在流程将来可能有能力。在这种情况下,计算60个测量数据点的Ppk将为我们估计临界轴测量的总体变化。Ppk包括子组变化和所有与过程相关的变化,包括偏移和漂移。这是另一个重要的区别:Cpk仅包括共同原因变异,而Ppk包括共同原因变异和特殊原因变异。
让我们看看两者之间的区别
•共同原因变化是许多经常存在的因素(即过程输入或条件),这些因素在不同程度上导致结果日复一日、周复一周的相对较小、明显随机变化。这些因素相互独立。所有共同原因的共同影响通常被称为系统变化,因为它定义了系统固有的变化量。通常很难(如果不是不可能的话)将随机、共因变化与任何特定来源联系起来。
这些可能包括噪声、运行振动和机器效率引起的复合变化,通常很难识别和评估,因为它们本质上是随机的。然而,如果仅存在随机变化,则过程输出形成随时间稳定的分布。
•特殊原因变化是除了随机变化之外,还会导致差异的因素。通常,特殊原因变化在数据中表现为极端效应或某种特定的、可识别的模式。特殊原因通常被称为可分配的原因,因为可以跟踪产生的变化并将其分配给可识别的来源。
这些包括由特殊效果引起的变化,这些特殊效果并不总是存在或内置于过程中。一些示例包括:感应温度和非受控环境因素、电涌、人员、工艺变化、工具调整、测量误差和材料变化。
让我们看看数学揭示的Cpk和Ppk
看看Cpk和Ppk的公式,我们可以看到它们几乎完全相同。唯一的区别是计算标准偏差的方式。
哪里:
CPU/CPL=处理能力上限/下限
PPU/PPL=潜在过程上限/下限
μ=XBar=(数据平均值)
σ在内部=子组内汇总的标准偏差
σ全面的=数据集、批次或总体的总体标准偏差
在上述等式中,计算在内部等数子组的Cpk标准偏差为:
哪里:
服务提供商=每个
子群,即{∑STDEV2./k}1/2
k=子组数
C4.=计算具有(d)自由度的非独立正态随机变量的标准偏差的预期(无偏)值。
η=样品总数
d=自由度
注:C4.(d) 应理解为:C4.of(d),不C4.次数(d). 那么你从哪里得到C4.对于(d),无偏标准偏差值?这些数据来自现成的统计表。例如:如果(d)=28,则C4.取(0.990786)
还请注意,计算子组大小为1.0的Cpk的特殊情况可以通过使用移动范围方程(未显示)估计标准偏差来完成。
这个全面的标准偏差更容易计算。这里不考虑子群,由
哪里:
X个=单个轴直径测量
n个=数据点总数
XBar=所有(60)个数据点的平均值
见图4。

现在让我们看看Cpk和Ppk之间的潜在差异
在我们的示例中,共制造了600个轴。100人中有10人在6小时内每小时测量一次。累计60个数据点。共有6个子组,共10个数据点。零件由一名操作员在同一台机器上以相同的方式在同一天制造。我们可以看到,子组内的平均标准偏差与总体标准偏差非常接近。因此,在这种特殊情况下,Cpk和Ppk的值应该非常接近——它们确实如此。(图5)

注:此示例是基于上下控制限值(直径规格)的双尾分布。因此,Cpk和Ppk被视为两次计算的出租人价值。
这就是在内部和总体标准偏差明显。如果我们不考虑时间顺序,从60个测量值中抽取30个测量值,组成3个独特的亚组,结果可能会大相径庭(我们永远不会这样做)。Ppk下限值和上限值之间的差值(1.72 vs.1.37)为+25%。然而,Cpk的差异是(3.13 vs.1.39)+125%!(图6)。结果来自图3中的数据。Cpk计算每个子组的标准偏差并汇总结果,而Ppk将所有数据的标准偏差计算为一个连续矩阵。

此示例显示了真正理解您正在调查的数据的重要性。提问:如何获取数据?它有多稳定?变化来自哪里?数据是否可信?它是如何组织的?是否有足够的数据点?这个过程会产生类似的结果吗,一批又一批,一次又一次?能力指数的统计置信度是否可接受?通常情况下,如果要根据一系列初始子组“快照”来决定零件和工艺是否可用于生产,那么就应该真正深入了解这些细节;因此,今天的Cpk与未来的长期过程能力没有太大区别。在这一过程中,您可能会发现最重要的事情是如何持续、自信地验证您的流程是否处于实际控制之中,是否真正有能力。
工具书类
- Paret M.和Sheehy P.“处于控制之中”加拿大质量部,2009年夏季.
- 能力分析(正常)公式–能力统计,http://www.minitab.com/support/answers/answer.aspx?ID=294
- 帕雷特M。过程能力统计:Cpk与Ppk
- K.M.鲍尔Cpk与Ppk“ASQ六西格玛论坛,2005年4月,www.ASQ。组织/六西格玛
- Symphony Technologies私人有限公司“衡量您的流程能力”. www.symphonytech。通用域名格式
- 柴郡A.”关于能力统计的问题–第1部分“2011年9月19日
- 托马斯·皮兹德克《六西格玛手册》,麦格劳·希尔,2003年,第467-484页
- 统计过程控制第2版“参考手册”,戴姆勒克莱斯勒/福特汽车公司/通用汽车公司供应商质量工作组,2005年7月
“本出版物/书籍中包含的部分信息是在Minitab股份有限公司的许可下印刷的。所有此类材料仍然是Minitab股份有限公司的专有财产和版权。保留所有权利。”