黄维纲,男,1970年生,副主任技师,主要从事临床化学检验的统计质量控制和实验室质量管理方面的研究。
目的比较分析医学领域较典型的能力验证(PT,即室间质量评价)组织者提供的评价参数,为临床实验室更好地分析和使用室间质量评价的报告,提高实验室检测质量提供帮助。
方法按中国合格评定国家认可委员会(CNAS)《能力验证提供者认可准则》(CNAS-CL03)对PT提供者的要求,分析PT提供机构在进行评价活动过程中应重视的环节和要素,通过比较医学领域较典型的4个PT提供者(即室间质量评价组织者,包括美国病理学家学会(CAP)、卫生部临床检验中心、美国纽约州Wadsworth中心和上海市临床检验中心)的室间质量评价汇总报告,对指定值、分组原则、评价标准、能力统计量进行比较,并选择2012年4个评价机构室间质评汇总表中的10个项目进行分析评价。
结果 4个室间质量评价组织者提供的室间质量评价汇总报告中的评价标准基本相同,均以美国临床实验室改进修正法规(CLIA’88)为基准,但4个机构对指定值、分组原则、能力统计量的确定各不相同,10个选择的分析项目的评价结果也各具特色,反映出不同法律框架和质量管理体系下以及评价实验室数量不同的情况下的差异。
结论PT组织者可提供更多有价值的参数,能为临床实验室评定自身检测能力,持续改进质量提供更有益的帮助。
评价一个实验室从事特定检测或测量的能力通常使用实验室间比对方法。能力验证(proficiency testing,PT)是利用实验室间比对,按照预先制定的准则评价参加者的能力[ 1]。这种方法广泛用于电气、机械、冶金、煤炭、建筑建材、检验检疫、医学检验等各个领域,对评定实验室从事特定检测的能力,识别实验室存在的问题,维持实验室持续的检测能力,建立检测方法的有效性和可比性,促进实验室能力的改进起到积极作用,为国际间、国内各地区间和各地区内的实验室相互合作和结果互认提供了基础。
PT具有极为广泛的含义,包括但不限于以下类型:定量计划、定性计划、顺序计划、同步计划、单次计划、连续计划、抽样、数据转换和解释等,目前最常见的PT计划包括定量测量、定性检测和解释性的计划3个基本类型。在医学领域的一些PT计划,使用术语“外部质量评价计划(EQA)”,不仅仅是检测过程和结果的评价,还包括分析前和分析后阶段的能力,以及实验室长期能力跟踪等模式,并提供教育的机会以促进实验室质量改进。中国合格评定国家认可委员会(CNAS)承认的通过CNAS-CL03《能力验证提供者认可准则》(ISO/IEC17043:2010)的中国PT提供者全国共25个机构[ 2],共有北京、上海、山东、辽宁、广东、山西、浙江、河北、江苏9个省市提供PT计划,涉及煤炭、食品、冶金、陶瓷、农产品、环境(水、气体、环境构成)、建筑材料、塑料、橡胶、玩具、家用电气、丝织品、动植物检验检疫、医学检验等多个领域,认可项目最少2项,最多1 176项,其中提供医学实验室PT计划的机构有卫生部临床检验中心[ 3]和上海市临床检验中心[ 4],包括临床化学、临床血液体液学、临床免疫学、临床微生物学、分子生物学5个专业,提供血清基质制备物、血浆基质制备物、全血、溶液、尿液基质制备物、新鲜冰冻血清、冻干菌株等样品作为验证物品。2012年,全国参加卫生部临床检验中心PT的有2 000多个实验室56个项目,外部质量评价计划项目200多项;上海地区参加上海市临床检验中心PT共800多个实验室82个项目,外部质量评价计划项目186项,其他各省市也多年组织本地区的室间质量计划,在医学实验室质量管理和质量控制和评价上建立了基础。国际上提供医学实验室的能力评价的机构有世界卫生组织(WHO)、国际临床化学协会(IFCC)、美国临床病理学家学会(CAP)[ 5]、美国纽约州Wadsworth中心(NYS)[ 6]、美国疾病预防与控制中心(CDC)、加拿大萨斯喀彻温省内外科医学会(CFX)、澳大利亚皇家病理学家学会(PCPA)、欧洲各国室间质量评价组织者以及亚洲各国室间质量评价组织者,这些机构对医学检验的发展有着深远的影响。
医学检验领域PT方法使用最普遍的是外部质量评价(即室间质量评价),属于PT中的同步计划,即由PT组织者选择评价样品,同时分发给参加计划的实验室进行检测,完成检测后将结果返回给组织者,与预期值比对,以确定该项目检测结果与目标值的差异,来评定实验室的能力。最早的室间比对可追溯到上世纪四十年代[ 7],WHO支持CAP进行临床实验室的质量改进。1949年,CAP开始临床化学和血库项目的室间质量评价。我国室间质量比对计划起步于1970年代末,1980年卫生部临床检验中心开始在全国范围内组织临床化学室间质评,上海市临床检验中心(原上海市医学化验所)和上海市医学会检验分会于1979年6月[ 8]开始在上海范围开展临床化学、临床检验、微生物和免疫学的室间质评活动,至今已有33年的历史,经过几代检验人员的努力,无论从项目、实验室数量和评价质量上都有了长足的进步。上海市临床检验室间质量评价概况[ 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22],见表1。
![]() | 表1 上海市临床检验室间质量评价概况 |
《能力验证提供者认可准则》(CNAS-CL03)中对PT提供者(PTP)提出了15条管理要素和10条技术要素,规定了PT提供者所需能力和建立、运作PT计划的通用要求;其提供的是一个规范不同行业、领域PT活动组织和实施的框架要求,有助于在不同实验室的检测、测量、校准或检查结果使用者之间建立起相互信任的一种机制。这项准则的管理要素与所有以ISO9000为基础的实验室认可准则相类似,包括组织架构和管理体系的建立、人员岗位资质和职责的确认、文件和记录的控制、客户服务以及合同评审、投诉和申诉、分包管理、不符合工作控制、纠正和预防措施、内审和管理评审、持续改进的要求。技术要素与其他认可准则完全不同,具有自身鲜明的特点,包括了PT计划的设计、运作、结果评价和报告,PT物品均匀性和稳定性评价,与参加者的沟通和信息保密等。最关键的要素是PT计划的策划、能力评定和最终报告3个环节。技术要求较高的是PT物品的均匀性和稳定性评价的方法、指定值及其不确定度的确定及参加者数据分析与结果评价,这些环节的工作质量反映了PT计划组织者的能力和技术水平。同时,PT活动对时效性要求很高,特别是在医学检验领域,要求PT提供者在尽可能短的时间里反馈结果,以便及时改进。所以一个方便、易用、快捷的信息平台非常关键,是为实验室提供准确、快捷服务的基础,是策划、运作、评价、反馈、指导改进的核心。这个信息平台需要系统工程、计算机软件编译和专业知识的有机融合,还要考虑偏远地区的计算机网络情况,将最先进的技术理念和底层的操作环境相结合,才能获得良好的应用效果。这是PT计划组织者能力的又一体现。
以下就CAP、NYS、卫生部临床检验中心和上海市临床检验中心提供的EQA报告作一比较和分析,为临床实验室更好地分析利用EQA的报告提高实验室检测质量提供帮助。这些资料都是网上发布的公开资料,如果与正式反馈结果报告有差异,以正式报告为准;同时,本研究的分析数据不作为商业产品评价的依据。
PT的结果可以按多种数据类型分布,分析数据的统计方法也应与分布特性相适应。而无论用哪一种方法对参加者结果进行评价,一般应包括以下几方面内容:确定指定值(公议值)、评价标准、PT统计量(包括不确定度的评定)、评价结果等。现以CAP、NYS、卫生部临床检验中心和上海市临床检验中心提供的EQA计划的网上汇总报告,比较临床化学、临床血液体液学、临床免疫学、临床微生物学、分子生物学的统计方法、评价方式以及10个项目的评价结果,供大家分析借鉴。
1. 各EQA提供机构概况 见表2:
![]() | 表2 各EQA提供机构概况比较[项目数(实验室数)] |
2. 各EQA提供机构的评价方法,见表3:
![]() | 表3 各EQA提供机构评价方法的比较 |
![]() | 续表 2 |
各EQA提供机构10个项目的汇总结果见表4:
![]() | 表4 各EQA提供机构 10个项目的汇总结果比较 |
![]() | 续表 4 |
1. 概况分析
4个EQA评价机构的比较数据显示,评价规模上卫生部临床检验中心与CAP相似,上海市临床检验中心与NYS类似;评价项目和内容上,CAP最多、最复杂,包括了临床病理(临床检验)和解剖病理(临床病理)、临床输血和献血服务、健康体检等方面内容,而中国国内的医学教育体系和医学检验服务不包括解剖病理(临床病理)部分,而是以病理科单独分列专业科室。国家和各省市临床检验中心只负责临床检验质量管理,各省市血液管理办公室负责献血服务和临床输血的质量管理,疾病预防和控制中心负责HIV检测的质量管理,形成了不同的评价格局。
2. 指定值和评价标准的确定
定量确定指定值(靶值)最佳方法是决定性方法或参考方法定值,其次是公议值或统计值,如稳健均值(算数均值、几何均值、对数均值等)、中位数等。而当组内统计数量较少时,采用均值就不一定合适,尤其在出现异常离群值时,使用中位数较合适,或者列出所有结果而不做评价更为合理。定性项目确定指定结果应使用决定性方法,如没有决定性方法,一般以所有结果80%一致性的结果为指定结果。但这种方式有局限性,即存在多数参加者结果错误,少数参加者结果正确反而错判的风险。这种情况下,需要设置一些防串通的措施,最好是使用参考实验室的定值。评价标准方面,各个国家都是依据生物学变异和医生公议数据,由法律、法规、标准或一些权威机构确定评价标准,这些数据很丰富,足以适应现有项目,不再赘述。
3. 评价样品的问题
PT计划所使用的样品各不相同,有自制新鲜血清、全血,有商品化质控品。选择评价样品时需要考虑样品中所含项目的数量,各项目检测值与医学决定水平的符合性,样品的均匀性和稳定性,包装及成本等;还要考虑评价样品与新鲜样品的一致程度,即样品的基质效应。一般基质效应越小,样品稳定性越差,样品既稳定基质效应又小,则价格成本就高。所以需要找到平衡点,关键是满足临床要求。当然,也不需过分强调基质效应。在某些项目中,质控品的基质效应与新鲜样本差异很小,可以认为总体一致。但有些检测系统即使使用新鲜全血或新鲜血清作为评价样品,但由于检测方法的差异,缺乏溯源系统,检测结果也有较大差异。这些检测系统就值得研究和改善。
4. 分组的问题
以什么方式分组非常关键,甚至比靶值、评价标准确定和评价样品选择更重要[ 29, 30]。合理分组是合理判断的基础。我们认为:以项目为单位,同一项目先分方法,在同一方法下再分检测系统,似乎更为合理,但须保持评价判断的独立性和公平性,不被商业利益左右。
5. PT的局限性
临床实验室控制检验质量的方法有很多,包括对分析前、分析中、分析后的诸多环节,涉及各种技术手段和管理服务方法。分析过程中的控制方法可以通过方法学验证(分析灵敏度、分析特异性、参考区间、精密度、正确性、患者结果可报告范围等)证实生产商声称的检测系统性能;可以通过设备保养和系统校准维持检测系统的良好状态;可以通过统计室内质量控制或使用患者样品进行质量控制)监控检测系统是否处于稳定运行状态[ 31, 32];可以通过患者样品的复核(特别是明显异常的结果)检查是否存在粗大错误或交叉污染;可以通过参加PT计划(或正确度评价计划)证实检验结果的正确性;当然,还必须控制好分析前和分析后的各种因素,使整个检验过程周密、流畅、简洁。PT是了解和衡量实验室当前检测能力的一种手段和尺度,是诸多质量控制手段中的一种,但PT活动本身并不能改进实验室的检测质量;实验室通过参加PT知晓实验室的检测结果在评价整体中所处的位置和/或自身存在的问题,是否真正存在问题,这个问题如何纠正;而只有通过校准,人员培训,改善室内质控方法,更新方法等工作,才能改进检测分析的质量。
综上所述,各个国家和地区所使用的主流检验仪器设备和试剂各不相同,疾病种类各异,关注的检验项目专业类型和所用方法学也有差异,参加PT提供者的实验室数量各不相同,专业分类和分组方法各异。因此,在设计统计方法时应考虑许多影响因素,如参加者数量、结果报告时间(TAT)、各项目的方法学差异、仪器和试剂组成的检测系统的差异、识别离群值的程序、估算指定值所用的程序、评价的标准、防止串通的方法和程序、数据汇总的方法和分析参数等等,需要根据不同项目及项目所使用的范围做出合理的划分,制定适宜的评价方法,达到更可靠和满意的效果。
[1] |
|
[2] |
|
[3] |
|
[4] |
|
[5] |
|
[6] |
|
[7] |
|
[8] |
|
[9] |
|
[10] |
|
[11] |
|
[12] |
|
[13] |
|
[14] |
|
[15] |
|
[16] |
|
[17] |
|
[18] |
|
[19] |
|
[20] |
|
[21] |
|
[22] |
|
[23] |
|
[24] |
|
[25] |
|
[26] |
|
[27] |
|
[28] |
|
[29] |
|
[30] |
|
[31] |
|
[32] |
|