北京物流信息联盟

GRADE在预后系统评价中的应用及实例解析

2021-06-12 13:58:46

一、预后系统评价概述[1]

预后研究系统评价是通过系统、全面地搜集证据,严格按照预先制定的纳入标准筛选研究,依据国际公认的研究质量评价工具评价纳入研究质量,并进行定性描述或定量分析的一种全面评价预后研究证据准确性和重要性的研究方法,也是预后研究中最高级别的证据。一般来说,根据所研究的问题,预后系统评价可以从四个方面来开展:①研究自然状态和当前卫生条件下的疾病病程(基础预后研究);②探索影响疾病预后相关的特殊因素(预后因素研究);③预测未来结局风险的统计学模型(预后模型研究);④利用预后因素,针对具有类似特征的患者群体选择最优治疗方案(分层医学研究)。

二、预后系统评价应用GRADE的基本原理[2]

预后研究系统评价中,无论其纳入的原始研究是RCT还是观察性研究,其起始证据质量都可以视为高,通过评估其可能存在的升降级因素,确定最终的证据质量。

1.偏倚风险

预后研究系统评价中的偏倚风险主要关注研究的局限性以及研究是否高估或者低估了事件发生率。例如不完整的随访可能会低估事件发生率,将病情类似的相关疾病错误纳入会高估事件发生率。GRADE工作组结合当前偏倚风险评估的标准,推荐从3个层面来考察预后研究系统评价的偏倚风险,分别为人群的代表性、随访的完整性以及结局测量的客观性和公平性。

2.间接性

预后研究系统评价的间接性主要包括两个方面:纳入研究包含的人群能否代表系统评价关注的人群,即人群外推性(generalizability),以及测量的结局能否代表患者的最终结局,即结局适用性(applicability)。

3.不一致性

GRADE对预后研究系统评价在不一致性上的判断与在干预性和诊断性系统评价中的判断相似,主要从纳入研究的差异(临床不一致性)、可信区间的方向和重叠程度(统计学不一致性)判断。

4.不精确性

一般情况下预后研究的系统评价因为主要是纳入观察性研究,因此样本量都相对较大,因为样本量造成不精确的可能性较小。对可信区间宽窄的判断需要结合临床阈值来综合考虑。

5.发表偏倚

GRADE对预后研究系统评价发表偏倚的判断方法与对干预性和诊断性系统评价相似。主要还是通过漏斗图来帮助判断。一般情况下,当研究间的不一致性较小时可以通过Egger检验来判断,不一致性较大时需要通过Begg检验来判断。

6.证据质量升级的因素

GRADE中升高证据质量的因素有效应量很大、存在剂量-效应关系以及负偏倚。在预后研究系统评价中大效应量可以理解为暴露组和非暴露组间的结果差异很大,并且这种差异难以用研究的偏倚来解释,从而提高证据质量。剂量效应关系可以理解为当事件发生数随着随访的时间变化呈现特征性规律时(如线性关系)可以提高对结果的信心。对于GRADE中第三个升高证据质量的因素——负偏倚,目前GRADE工作者也暂未在预后研究中找到合适的案例来解读。

三、预后系统评价应用GRADE的案例分析

我们以2014年发表在《中国全科医学杂志》的《非甲状腺病态综合征和急性心肌梗死预后相关的Meta分析》一文作为案例[3],具体解读GRADE在预后系统评价中的应用。

1.偏倚风险

本案例采用非随机研究偏倚风险评估方法(Newcastle-Ottawa scaleNOS)对纳入研究的偏倚风险进行评。总体来看,案例中纳入研究的暴露因素确定方法明确,研究起始无效应指标,研究结果明确客观,研究无数据缺失或已对缺失数据进行分析。总体偏倚风险较小,在偏倚风险领域不考虑降级。

2.间接性

在人群外推性方面:案例纳入的研究人群AMI诊断标准均符合欧洲心脏病学会/美国心脏病学会标准,因此对AMI患者的选择具有代表性。在结局适用性方面:采用的结局指标为近期(30d及以内)严重心血管事件发生率和远期(1年及以上)死亡率,不存在间接性。因此在间接性方面不降级。

3.不一致性

在临床不一致性方面:尽管纳入研究对年龄、性别、既往病史等一些混杂因素进行控制,但纳入AMI患者存在种族差异,此外对于远期死亡率,各研究的随访时间不同,部分死亡事件可能未被记录。在统计学异质性方面:近期严重心血管事件发生率的Meta分析的I2值为0.0%,不存在异质性。而远期死亡率的Meta分析I2值为80.7%,存在严重的异质性。综上所述,对远期死亡率结局考虑在不一致性方面降一级。

4.不精确性

本案例中合并NTIS患者近期严重心血管事件发生率是正常甲状腺功能AMI患者的2.38倍,其差异具有统计学意义[RR=2.38,95%CI(1.77,3.18),P=0.000];远期死亡率为2.71倍,其差异具有统计学意义[RR=2.71,95%CI(1.28,5.74),P=0.001];两者的可信区间未跨越临床决策阈值线,因此在不精确性方面不考虑降级。

5.发表偏倚

本案例发表偏倚评价的Begg检验(Z=1.02,P =0.308)和Egger检验(t =2.08,P=0. 172)显示无统计学差异,不存在发表偏倚,因此在发表偏倚方面均不考虑降级。

6.证据质量升级因素

由于本案例起始质量已经为高,因此不考虑升级因素,仅进行案例分析。本案例对于近期严重心血管事件发生率与远期死亡率是正常甲状腺功能AMI患者的2.38和2.71倍均属于大的效应量。由于本案例未报告严重心血管事件和死亡事件数与随访时间之间的相关关系,因此未能显示两者间的剂量-效应关系。对于负偏倚,本案例中合并NTIS患者相对于甲状腺功能正常AMI患者可能受到更好的照护,因此削弱合并症增加发生率或死亡率的效应,属于“相反的混杂因素”,即负偏倚。

当前分级结果呈现形式主要是基于GRADEpro软件和GDT软件[4],其具体使用方法详见第30期,本章仅简要呈现上述案例分级结果(表1)。 

表1  GRADE级结果

 

非甲状腺病态综合征和急性心肌梗死预后相关性的Meta分析


质量评价

效应量

证据等级



研究个数(样本量)

研究设计

偏倚风险

不一致性

间接性

不精确性

发表偏倚

(95% CI)


近期(30d及以内)严重心血管事件发生率


42117

队列研究

不降级

不降级1

不降级

不降级

不降级

RR 2.38

(1.77, 3.18)

ÅÅÅÅ



远期死亡率


41931

队列研究

不降级

降一级1,2

不降级

不降级

不降级

RR 2.71

(1.28, 5.74)

ÅÅÅO




1
种族存在一定的异质性,但纳入样本主要为中国人群;

2 I250%

四、与实践指南注册平台的关系

国际实践指南注册平台(http://www.guidelines-registry.cn)建议指南制订者在制订指南的过程中,应用GRADE分级标准对指南中的证据质量和推荐强度进行分级。在应用GRADE系统时应注意其适用范围和条件,避免误用和滥用。

 

参考文献

[1]     陈耀龙. GRADE在系统评价和实践指南中的应用[M]. 兰州大学出版社, 2017.

[2]     杨楠, 邓围, 陈耀龙,. GRADE在预后研究系统评价中应用的原理、方法及挑战[J]. 中国循证医学杂志, 2015, 15(9):1112-1116.

[3]     王俊薇, 任颖, 邵琦,. 非甲状腺病态综合征和急性心肌梗死预后相关性的Meta分析[J]. 中国全科医学, 2014, 17(31):3724-3728.

[4]     http://gdt.guidelinedevelopment.org/central_prod/_design/client/index.html#


友情链接

Copyright © 2023 All Rights Reserved 版权所有 北京物流信息联盟