客人列2021年11月1日

计算清洗过程的过程能力:底漆

安德鲁·沃尔什(Andrew Walsh)、米奎尔·罗梅罗·奥本(Miquel Romero Obon)和奥瓦伊斯·穆罕默德(Ovais Mohammad)著

专家网络

的一部分21世纪的清洁验证系列

随着ASTM E3106标准的发布12017年,制药行业开始向基于科学、风险和统计的清洁工艺开发和验证方法发展。由于这种变化,过程能力已成为一个关键的重要措施,以证明可接受的性能的清洗过程。2过程能力对于测量与这些清洗过程相关的风险也是至关重要的3.并最终确定清洁验证所需的工作水平、形式和文档。4显然,理解计算过程能力以及如何将其应用到清洗过程中,对于实施ASTM E3106的科学和基于风险的方法是必不可少的。这篇文章将解释什么是过程能力,可以用来计算过程能力的各种技术,以及它应该如何应用于清洁过程。

过程能力简介

过程能力(CP)简单地表示流程数据(其可变性)的传播与该流程规范的传播的比率。基本上,它衡量的是数据在其规范范围内的分布情况。当一个进程的数据传播包含在它的规范传播内时,这个进程就被称为是有能力的。流程数据的分布越小,流程的能力就越强。这些CP概念如图1所示:

图1:过程扩展与规范扩展的比较

许多指标被用作过程能力或过程潜力的度量。其中有广泛使用的CpCpkCpl,和C聚氨酯.表1用工艺平均值(μ)、工艺标准差(σ)、规格下限(LSL)、规格上限(USL)定义了这四个标准指标:

表1:过程能力的标准指标

指数Cp和Cpk用于同时具有上限和下限规范限制(即,规范限制是双向的)的过程的能力度量。另一方面,对于只有较低或较高规格限制的过程(即,规格限制是单方面的,例如清洗数据),CPL和C聚氨酯是用来衡量他们的能力和Cp不是。指数CPL和C聚氨酯比较过程数据的上、下扩散到数据中心(即均值)到规格上限和规格下限的距离。(注:当使用单边规格时,Cpk不是指C的最小值聚氨酯和CPL而是单边限制的上限或下限。)

图2a显示了一个假设数据,平均值为100,标准差(σ)为15,在25到175的规格范围内进行分析,结果是Cp1.67。这是一个好结果。然而,数据很少精确地集中在规范范围内,通常更接近于一个规范限制而不是另一个。标准Cp计算不会揭示这一点。作为一个极端的例子,图2b显示了100%的数据可以超出规范范围和Cp计算结果是一样的。应该理解过程能力是由Cp只能揭示过程是什么潜在的能力满足规格范围-不是说它确实满足规格。

图2a:过程能力(Cp)示例1-这个图显示了所有在规格范围(25到175)内的数据的假设数据,这产生了一个Cp1.67。图2b:过程能力示例2 (Cp)-这个图显示了假设的数据,但所有数据都超出了规格范围(175到325),这仍然会产生Cp1.67。

对C的改进p提供了更好的过程信息的计算是Cpk(工艺能力指标)计算。CpkIndex是专门为不在规范范围内的流程设计的。该指数只考察均值与最接近均值的规格限制之间的距离。在这些情况下,C聚氨酯(用于规格上限(USL))或Cpl(对于下规格限制(LSL)),这些是数据平均值从规格上限或下限到数据分布的一半(其可变性)的简单比率。

图3显示了两个假设数据集的绘图和处理能力计算。顶部的数据集的平均值为100,位于上下规格限制之间,标准偏差为15。可以看出,能力指标Cp和Cpk这些数据也是一样的。而图3中较低的数据集的平均值为85,不在上下规格限制之间居中;标准差还是15。在这种情况下,随着平均值向较低的规格限制C偏移pk值小于Cp价值。这种变化使数据集在其规格上限上看起来更好,但在其规格下限上更糟糕。

图3:显示过程能力指数计算的示例

评估过程能力的假设

从上面的公式可以看出,计算这些过程能力指数(PCIs)是简单而直接的。但是,应当指出,这些计算是基于以下假设:过程数据是正态(或近似正态)分布的,并且过程是稳定的(没有明显的趋势,如漂移和/或平稳)。

情况下,过程数据不是正态分布或不得将从不同的位置(例如,棍结果在清洗资质/验证运行,收集的样本不是做在一个特定的序列或订单),一组不同的指标,被称为过程性能指数(ppi),用于将工艺数据与规格限制进行比较。这些指标用P表示PPPKPPL和P聚氨酯,are used in place of CPCPKCPLC聚氨酯分别,使用标准差的去趋势估计来测量对规范的遵从性。计算这些指标的公式与计算pci的公式相同,唯一的区别是使用的标准偏差类型。在估计ppi时,使用组或短期标准差(使用控制图估计的一个),而在估计ppi时使用整体或长期标准差(即所有值的标准差)。5类似地,当工艺数据不是正态分布时(例如,微生物数据),基于拟合分布的百分位数或经验分布的不同公式用于计算PCIs或PPIs。这些修改过的索引与前面讨论的标准pci的解释方式相同。为了便于理解,本文只使用标准pci使用的符号。

过程能力的要求

在六西格玛或卓越运营计划中,这些过程能力计算产生的价值被认为是解释过程可接受程度的关键。表2显示了这些值广泛使用的准则。

表2:过程能力值的六西格玛定义

这些所谓的“六西格玛”程序的目标是开发或改进制造工艺,使他们在工艺数据的两侧有额外的三个标准差(西格玛)空间,这在数学上计算出Cp为2.0。值得注意的是,在实践中,许多公司仅仅满足于达到5西格玛(Cp = 1.66),并认为努力达到6西格玛(Cp =2.0)不值得额外的成本和努力。达到1.66的过程能力被认为是非常好的。

根据所测量的过程,还有其他推荐值。对于具有双面规格的工艺,Montgomery7对于现有工艺建议Cp/Cpk的最小值为1.33,对于新工艺或涉及关键属性/参数(例如,安全性或强度)的现有工艺建议Cp/Cpk的最小值为1.50,对于涉及关键属性/参数(例如,安全性或强度)的新工艺建议Cp/Cpk的最小值为1.67。与片面的流程规范,他建议Cpu / Cpl的最小值:1.25现有流程,1.45新流程或现有流程涉及关键属性/参数(例如,安全或强度),1.60,新流程涉及关键属性/参数(例如,安全或强度)。

与从样本数据估计的其他统计参数一样,计算的过程能力值仅是真实过程能力的估计,由于抽样误差,具有不确定性。因此,为了解决这些不确定性,在做出有关过程能力的决策时,谨慎地比较估计过程能力指数的下限或上限与能力需求。今天几乎所有使用的统计软件都能提供过程能力值的置信区间。对于图3所示的两个示例数据集,C的95%单边下界聚氨酯估计为1.47(中心过程)和1.75(非中心过程)。由于这个值低于2.0,我们不能最终推断该过程已经达到了6西格玛的目标。

清洗过程能力

正如我们所看到的,过程能力是一个相对容易计算的重要过程性能度量,因为它只需要过程数据的平均值和标准偏差以及该过程的规格限制。因此,在清洗过程中,清洗过程的工艺能力可以从清洗过程中的拭子或漂洗数据的平均值和标准差以及基于健康暴露限(HBEL)的拭子或漂洗数据的清洗限值计算出来。

确定过程能力(C聚氨酯),这个方程中的项可以用清洗(拭子或漂洗)数据估计的值和基于hbel的清洗极限代替,如方程5中的例子所示。

Minitab、JMP、“R”等统计软件以及其他许多统计软件都能够执行过程能力分析并将结果绘制成图形,例如图4中的示例报告。

图4:模拟棉签数据的Minitab过程能力分析示例-该图显示了拭子样本数据(N=199)的处理能力,平均值为151 ppb,标准偏差为50 ppb。假设的hbel上限是1000 ppb或1ppm。过程能力显示为整体能力的过程性能上限(PPU),数值为5.55;过程能力上限(CPU),数值为5.66。Minitab提供了计算过程能力值置信区间的选项,因为均值、标准差和N都是已知的。当样本数量很少时,这个选项特别有用。CPU的置信区间是5.10和6.22,这意味着基于样本的数量(N), CPU可能低至5.10,也可能高至6.22。该图还显示了每百万(PPM > USL)中观察到的和预期的故障数为0.00。

此外,由于过程能力值是由均值和标准偏差得出的,因此可以计算这些过程能力指数的上、下置信区间。在可能有变化或小样本量的情况下(例如,N通常< 25),建议报告和使用C的低置信限聚氨酯而不仅仅是C聚氨酯本身。今天几乎所有使用的统计软件都能提供过程能力值的置信区间。图4显示了使用Minitab 17的示例。在右侧的文本框中,从Minitab报告的输出,C聚氨酯为5.66,另外报告了C的95%置信区间(CI)聚氨酯取值范围为5.10 ~ 6.22。(注:Minitab报告C的CIpk,哪个是C聚氨酯或Cpl;这里是C聚氨酯。

Minitab还可以根据工艺能力分析报告一百万次失败的预期数量。在这个例子中,下面的文本框报告,基于这些数据,在100万中可能有0.00个失败(即超过规格上限)。这表明在本例中发生清除失败的概率非常低。

对异常数据的处理能力

对于读者来说,理解估算过程能力的计算(在公式4和5中)是基于过程数据正态分布(或近似正态分布)的假设是很重要的。然而,并非所有清理数据都遵循正态分布。例如,总有机碳分析的拭子数据通常是正态分布的,而HPLC数据往往不是。在对清理数据进行任何统计分析之前,确定数据是否为正态分布是很重要的。如果清洗数据不是正态分布的,在这些情况下可以使用以下选项:

  1. 将数据转换为正态分布。当遵循这一策略时,限制也应该相应地改变。
  • Box/Cox变换(幂)将数据提升到平方、平方根、对数或倒数。
  • 约翰逊变换选择一个最优变换函数。
  1. 识别数据分布并使用非正态分布模型评估数据。8、9
  • 对数正态,伽马是一些例子
  1. 使用非参数方法评估数据。
  • 经验百分位方法

当使用选项2时,有必要确定使用哪一个非正态分布模型。Minitab有一个测试(个体分布识别),可以针对12个不同的和常见的分布评估数据。在此基础上,选择最优拟合分布模型。例如,图5显示了Minitab生成的比较四种分布(正态分布、对数正态分布、伽马分布和指数分布)的图。正在分析的数据集是从伽马分布中随机生成的数据。对图表的解释是基于对数据沿预期(红色)线的下降程度以及分布的拟合优度检验的p值是否大于0.05的目视检查。红线表示的是,如果它们遵循特定的分布,数据应该落在哪里。如果数据没有沿着红线下降,那么数据就不太可能来自那个分布。如果数据按照红线显示,那么下一个要检查的标准就是p值。按照惯例,p值应该大于0.05,表明数据遵循这种分布的概率至少为1:20,并且认为使用这种分布分析数据是足够安全的。

图5:个体分布识别-这个图显示了从伽马分布生成的10,000个随机值的数据集的评估。Minitab允许针对12个分布模型和两个转换(Box-Cox和Johnson)测试数据。评估是通过视觉和统计两种方式进行的。

在图5中,正态分布和对数正态分布的图明显脱离了它们的红线,p值也小于0.005。因此,这些分布将被适当地拒绝作为分析这些数据的良好模型。伽马图和指数图紧密地沿着它们的红线,彼此看起来非常相似。对它们的p值进行检验,发现伽马值为0.250,指数值为0.522。两个发行版都通过了选择标准。

但是是否应该选择指数分布因为它有更高的p值即使我们知道数据来自伽马分布?较高的p值并不表明指数分布是最佳选择;它只意味着数据的分布在统计上与指数分布没有显著的不同,只是有更少的证据拒绝指数分布作为数据的良好拟合。选择使用哪种分布应该基于数据是从哪里收集的以及数据将遵循哪种类型的分布。还应该理解的是,伽马分布实际上是分布的“族”,根据其形状和尺度参数,伽马分布可以密切遵循指数分布,这解释了图5中的结果。

图6显示了使用gamma分布(左)和指数分布(右)对图5中的数据进行的处理能力分析。很明显,分布和处理能力结果都很好地描述了数据,基本上是相同的。在这种情况下,以及在许多其他情况下,分布模型的选择并不重要。此外,在确定统计上符合数据的多个分布时,对数据进行可视化检查可能会很有帮助。

图6:使用Gamma和指数分布从Gamma分布生成的数据的过程能力分析-这些图显示了使用gamma和指数分布生成的10,000个随机值的数据集的处理能力评估。对数据的分析没有差异。这是因为两种分布模型的数据都非常吻合。

作为使用非正态分布的替代方法,有基于拟合/经验分布的百分比的不同公式,可用于计算过程能力。如果已知或可以假设过程数据的分布,则使用式6中的公式计算过程能力指标Cpu。在方程中,P50和P99.865是50th(中位数)和99.865th特定分布的百分比。6

类似地,当过程数据的底层分布未知时,可以使用McCormack等人提出的经验百分位数法计算的非参数(无分布)Cpu变量。8使用该方法的Cpu计算如式7所示。在方程中,P50和P99.5是50th(中位数)和99.5th百分比的经验分布,分别。

该方法只能在样本量≥100时使用。Minitab的网站上有一个基于McCormack方法计算非参数能力指数的宏。10

这些修改过的索引的解释方式与前面讨论的标准Cpu相同。在附录I和II中给出了决策树识别Cpu计算方法的例子。

所有的模型都是错误的,但有些是有用的

有些读者可能会惊讶地发现,正如我们在图5中看到的,可以使用多个分布模型来分析数据,而不是“正确的”分布模型。事实上,这是完全可以接受的,因为事实上,没有“正确的”或“绝对正确的”模型。这一段的引言通常出自统计学家George E. P. Box,这句引言被认为是著名的,主要在统计学家中。

George E. P. Box进一步阐述了这一观点,他说:

“记住,所有的模型都是错误的;实际问题是,它们要错到什么程度才不会有用。”12

Box的评论与本文最相关,因为在清洗验证社区中有声音声称,过程能力不适合清洗或无法确定,因为清洗数据是不正常的,或简单地说统计数据对清洗是不必要的。因此,由于担心分析计算不正确和产生严重的错误,对采用这些技术一直有所犹豫。然而,使用多个分布计算的过程能力的比较表明,如果遵循了适当的选择过程,这种错误是最小的。13附录I和II提供了两种决策树,可以遵循它们来最小化选择模型时的错误。

结论

许多制药公司在过去10年或更久的时间里实施了六西格玛计划,并逐渐认识到过程能力分析的重要性和价值。这些公司也已经认识到小于1.00的过程能力是不够的。他们还明白,大于1.66的过程能力是可以实现的,实现这个级别的过程能力的好处非常值得付出努力。对于许多清洗过程,可以很容易地实现大于10的过程能力!事实上,表2中六西格玛程序的建议值并不适用于清洁过程,因为它们很容易具有更高的过程能力。

工艺能力评估提供了关于清洗工艺的重要知识和理解,并允许定量测量残留遗留给患者的风险。了解清洁过程能力所能提供的风险水平,也有助于实施ICH Q9的第二原则,并证明“与清洁验证过程的风险水平相称的努力水平、形式和文件”是合理的。4从这种清洗过程能力估计中获得的知识和理解甚至可以证明使用更简单的分析方法,如清洗验证或验证的目视检查。14、15

同行评审

作者要感谢托马斯·奥特曼;乔尔Bercu博士;詹姆斯Bergum博士;Sarra Boujelben;阿尔弗雷多Canhoto博士;加芙克鲁兹博士;马洛里德根那罗;Parth德赛;Jayen Diyora;David Dolan博士,DABT, Kenneth Farrugia; Andreas Flueckiger, M.D.; Christophe Gamblin; Ioanna-Maria Gerostathes; Ioana Gheorghiev, M.D.; Jessica Graham, Ph.D.; Laurence O'Leary; Prakash Patel; Kailash Rathi; Stephen Spiegelberg, Ph.D.; and Basundhara Sthapit, Ph.D.; for reviewing this article and for providing insightful comments and helpful suggestions.

参考文献

  1. 美国材料试验学会(ASTM) E3106-18, "基于科学和风险的清洁工艺开发和验证标准指南,“www.astm.org。
  2. Walsh, Andrew, Ester Lovsin Barle, David G. Dolan, Andreas Flueckiger, Igor Gorsky, Robert Kowal, Mohammad Ovais, Osamu Shirokizawa, Kelly Waldron,“用于评估共享设施中产品交叉污染风险的工艺能力衍生量表”,《制药在线》2017年8月
  3. Walsh, Andrew, Thomas altman, Alfredo Canhoto, Ester Lovsin Barle, David G. Dolan, Andreas Flueckiger, Igor Gorsky, Jessica Graham, Ph.D., Robert Kowal, Mariann Neverovitch, Mohammad oais, Osamu Shirokizawa and Kelly Waldron, "清洗中的风险度量:清洗FMEA和清洗风险仪表板,药学在线2018年4月
  4. Walsh, Andrew, Thomas altman, Ralph Basile, Joel Bercu博士,Alfredo Canhoto博士,David G. Dolan博士,Pernille Damkjaer, Andreas Flueckiger, M.D, Igor Gorsky, Jessica Graham博士,Ester Lovsin Barle博士,oais Mohammad, Mariann Neverovitch, Siegfried Schmitt, phd and Osamu Shirokizawashirkizawa矩阵:确定清洁验证中的工作水平、形式和文档,2019年12月
  5. ASTM E2281-15(2020),过程能力和性能测量的标准实践,ASTM国际,West Conshohocken, PA, 2020, www.astm.org
  6. T. Pyzdek,《六西格玛手册》,2003,McGraw Hill
  7. 蒙哥马利,华盛顿,”统计质量控制导论,第七版(2012),John Wiley & Sons, Inc。
  8. Iso / tr 22514-4 (2007) "过程管理中的统计方法。能力和性能。第4部分:过程能力估计和性能测量”。
  9. D. W. McCormack, Jr., Ian R. Harris, Arnon M. Hurwitz & Patrick D. Spagon(2000)“非正常数据的能力指数”,质量工程,12:4,489-495,DOI: 10.1080/08982110008962614
  10. Cathy Akritas, Macro: ECAPA。MAC,非参数性能分析,可在https://support.minitab.com/en-us/minitab/18/macro-library/macro-files/quality-control-and-doe-macros/non-parametric-capability-analysis/上获得(截至2021年9月9日)
  11. 张P.L.和Lu K.H.(1994)任意形状的分位数分布的PCI计算。质量世界,技术科,20,110-114。
  12. 博克斯,乔治·E.P.和诺曼·r·德雷柏"经验模型建立和响应面,“威利‎;第一版(1987年1月1日)
  13. 沃尔什,安德鲁。”清洁验证-科学、风险和基于统计的方法,“第1版(2021年)ISBN: 978-0-578-89661-8
  14. P.德赛和A.沃尔什目视检查作为清洁验证的分析方法的验证,“药学在线,2017年8月。
  15. 安德鲁·沃尔什,拉尔夫·巴西勒,奥伊斯·穆罕默德,Stéphane堂兄,玛丽安·诺维契,和四木泽治,”ASTM E3263-20:药品生产设备和医疗器械残留目视检验合格标准实施规程2021年1月

附件我

确定Cpu计算方法的决策树(例1)

附录二世

确定Cpu计算方法的决策树(例2)