断断续续接了几个统计咨询,都是计算诊断试验各评价指标及其95%CI(Confidence Interval,置信区间),其中95%CI以bootstrap法实现,想着有必要整理一下各评价指标,送给有需要的人。
我们知道,快速、准确地对疾病作出诊断或排除,是对患者实施科学、规范化治疗的基础。疾病的诊断首先是基于简单的、易于获取的临床资料(比如病史、体征、人口学特征),然而,有部分疾病在症状和体征上极其相似,依靠上述资料无法对患者是否患有目标疾病作出明确判断,此时,临床医师就需要借助现有的物理检查,影像学检查或者实验室检查手段。
其实在大多数情况下,多个诊断手段之间并不矛盾,因而,相较于比较单个诊断手段之间孰优孰劣,读者更关心的往往是“联合使用各诊断手段是否有助于提高诊断准确性”。不过二者的核心思想一致,不过是从比较A与B变成了比较A与A+B。
我们知道,临床诊断性试验的评价首先要确立“金标准”,即最终可以确诊疾病的标准,比如,肿瘤诊断的金标准是病理检查。这时你可能会纳闷,既然都有金标准了,直接使用金标准判断不就得了,还整其他幺蛾子干啥?这里需要指出的是,尽管金标准是作为疾病诊断的最终手段,但是这并不排斥新的手段在疾病诊断中的作用和地位。因为金标准虽然是疾病确诊的最终标准,但是其本身也具有无法克服的缺陷,比如,病理检查是有创的检查。正因如此,我们才需要去探索新的诊断手段,以弥补金标准的缺陷,丰富疾病的诊断手段。
啰嗦了这么多,咳咳!进入主题,有哪些评价一项诊断手段的优劣指标呢,罗列如下,不周全之处,还请包涵,小编能力有限
诊断手段 | 待评价试验 | ||
金标准 | 诊断结局 | + | - |
+ | a | b | |
- | c | d |
1. Accuracy准确度
定义:研究对象中诊断正确的例数占总例数的比例
计算公式:
Accuracy=(a+d)/(a+b+c+d)×100%
2. Sensitivity灵敏度
定义:患者被诊断为阳性的概率
计算公式:Sensitivity=a/(a+b)
3. Specificity特异度
定义:无目标疾病者被诊断为阴性的概率
计算公式:Specificity=d/(c+d)
4. Youden约登指数
定义:平衡灵敏度和特异度的综合指标
计算公式:
Youden=sensitivity+specificity-1
5. False Negative Rate假阴性率/漏诊率,简称FNR
定义:患者被诊断为阴性的概率
计算公式:
FNR= b/(a+b) =1-sensitivity
6. False Positive Rate假阳性率/误诊率,简称FPR
定义:无目标疾病者被诊断为阳性的概率
计算公式:
FPR= c/(c+d) =1-specificity
7. Positive Predictive Value阳性预测值,简称PPV
定义:诊断为阳性时,实际为患者的概率
计算公式:PPV= a/(a+c)
8. Negative Predictive Value阴性预测值,简称NPV
定义:诊断为阴性时,实际为无目标疾病者的概率
计算公式:NPV= d/(b+d)
9. Positive Likelihood Ratio阳性似然比,简称PLR
定义:真阳性率与假阳性率之比,PLR>10时,诊断准确性显著增加
计算公式:
PLR= sensitivity/(1-specificity)
10. Negative Likelihood Ratio阴性似然比,简称NLR
定义:假阴性率与真阴性率之比,NLR<0.1时,诊断准确性显著增加
计算公式:
NLR= (1-sensitivity)/ specificity
11. Area Under Curve受试者工作特征曲线下面积,简称AUC
定义:ROC曲线下的面积。AUC在0.5-1之间,一般认为,AUC在0.50-0.70为较低准确度,在0.71-0.90之间为中等准确度,高于0.90则为高准确度。
计算公式:求解的数学原理应为定积分,可通过SPSS等多种软件实现,且AUC的95%CI也可以通过SPSS获得。
12. Harrell’ Concordance Index一致性指数,简称C-index
定义:主要用于计算生存分析中的COX模型预测值与真实值之间的区分度,即配对样本中预测的生存概率高的一位的生存时间长于另一位的概率。C-index在0.5-1之间,一般认为,C-index在0.50-0.70为较低准确度,在0.71-0.90之间为中等准确度,高于0.90则为高准确度。
计算公式:C-index=一致的对子数/有用的对子数
(将所有样本两两配对,有用的对子数指能够判断出谁先死的对子的个数,一致的对子数指两个病人如果生存时间较长的一位其预测生存时间长于另一位,或预测的生存概率高的一位的生存时间长于另一位。)在R中可利用survival、Hmisc、compareC包实现,其中survival包构建的Cox模型结果中即有Concordance。
13. Net Reclassification Improvement净重分类改良指数,简称NRI
定义:在某个截断值时两个诊断试验的相对好坏,可通过Z检验得到P值
计算公式:NRI= (灵敏度test2+特异度test2) - (灵敏度test1+特异度test1)
可通过R包mcca里的nri( )函数计算,或者通过包nricens里的nribin( )计算,后者可根据不同截断值求得NRI的点估计值和95%CI。
14. Integrated Discrimination Improvement综合区分改良指数,简称IDI
定义:两个诊断模型所有可能的截断值下的综合灵敏度及特异度差值,也即两个诊断模型区分斜率的差异,可通过Z检验得到P值
计算公式:
IDI= (综合灵敏度test2+综合特异度test2) - (综合灵敏度test1+综合特异度test1)
可通过R包mcca里的idi( )函数计算。
15. Odds ratio优势比,简称OR
定义:待评价试验预测分类为1时相较于预测分类为0时的风险比
计算公式:将待评价试验的预测分类作自变量,金标准分类结果为因变量,构建logistic回归,得到待评价试验的优势比及95%CI。
参考文献:
【1】 http://www.shengxin.ren/article/104
【2】 https://baike.baidu.com/item/阳性似然比/6321330
【3】 http://www.ttdoc.cn/article/394.jhtml
【4】 胡志德, 邓安梅. 开展实验室诊断试验研究值得注意的几个问题[J]. 检验医学, 2013, 28(6):551-555.
【5】 Pencina M J, Sr D R, Demler O V. Novel metrics forevaluating improvement in discrimination: net reclassification and integrateddiscrimination improvement for normal variables and nested models.[J]. Statisticsin Medicine, 2012, 31(2):101–113.
【6】 Pencina MJ, D’Agostino RB Sr, D’Agostino RB Jr,Vasan RS. Evaluating the added predictive ability of a new marker: from areaunder the ROC curve to reclassification and beyond. Statistics in Medicine,2008, 27:157–72.