sunnyredzqqq
ROC曲线在我的记忆中,是在本科三年级的循证医学课,预防医学课上学过的,现在已经很模糊了,但是好像需要用上,这一次来回顾下: ROC曲线 (receiver operating characteristic curve) ,又称受试者工作特征曲线,或感受性曲线 (sensitivity curve) . 用简单的话概括,就是用于评价,比较诊断性实验的效果,是否有应用价值。或者选择适合的截断值,用于诊断实验。 ROC曲线纵坐标为真阳性率(TPR灵敏度),横坐标为假阳性率(1-特异度FPR)。关于真阳性率,假阳性率等的概念这里不做赘述。曲线越靠近左上角,越有诊断价值,ROC曲线下面积越大,越有应用价值。
在一个二分类模型中,如风险打分模型,假设采用逻辑回归分类器,
其给出针对每个实例为正类的概率,那么通过设定一个阈值如,概率大于等于的为正类,小于的为负类。对应的就可以算出一组(FPR,TPR),在平面中得到对应坐标点。
ROC曲线实际上也是由一系列的点所构成,即模型的阈值不断变化,随着阈值的逐渐减小,越来越多的实例被划分为正类,但是这些正类中同样也掺杂着真正的负实例,即TPR和FPR会同时增大。阈值最大时,对应坐标点为(0,0),阈值最小时,对应坐标点(1,1)。
对基因表达打分模型的理解也类似,根据risk score可将sample分为高风险与低风险组,而高低风险组与实际的alive, dead存在差异, 因此每个sample的score分数都不一,依次以sample的score(或正样本的预测概率)作为阈值,可得出与sample数相同的点数,其阈值改变,TPR,FRP随之改变,因而出现了我们常见的曲线。
从AUC判断分类器(预测模型)优劣的标准:
参考资料链接:
Posted on
To be or not to be is only a part of the question, the question also includes how long to be. 生存分析(survival analysis), 不想用难懂的术语去解释,很讨厌课本上的复杂句式,好像不搞那么复杂就很low?明明本身是很简单的概念。 我们来对比一下: A: 生存分析是将事件的结果和出现这一结果所经历的时间结合起来分析的一种统计学方法。(官方) B: 生存分析就是将观测和生存时间结合起来分析的统计学方法。目的在于显示某因素与生存时间的关系。(自己的) 读完A后的感觉就是我还要再去读两遍,然后问生存分析到底是干嘛的? 生存时间的类型:完全数据(从起点到死亡),截尾数据(从起点到某一时间点)
生存资料的特点:含有截尾数据,截尾数据的真实生存时间未知,但确定的是大于生存时间。一般不呈正态分布。
条件生存概率:如年条件生存概率,月条件生存概率。
生存率:如5年生存率,指经过5年后,仍存活的概率。
生存曲线(Survival curve):以随访时间为横轴,生存率为纵轴,将各点连成曲线。
应用于基因表达高低,可分为两组,高表达,与低表达。
分析资料: 1)估计:Kaplan-Meier法(K-M法),由Kaplan和Meier于1958年提出,适用于小样本和大样本。 2)比较:log-rank检验,非参数检验,用于比较两组或多组生存曲线。检验统计量为卡方。实为单因素分析, 要求各曲线不能交叉,如交叉提示存在混杂因素。 3)影响因素分析:Cox比例风险回归模型(最重要的模型之一),多因素分析方法,1972年提出,不考虑生存 时间分布,利用截尾数据。 4)预测:Cox回归模型预测生存率
打怪兽789
《中华医学杂志》、《中国公共卫生》、《中国卫生经济》、《中国中药杂志》、《时珍国医国药》医学类sci什么杂志好发医学类SCI杂志期刊里没有绝对好发,或者说容易发的期刊。很多人会说低分的为灌水期刊而高分的难发一些。不懂科研的人才会认为做科研存在最小工作量的颠覆性技巧。相对而言,OPEN ACCESS类的SCI期刊要比正常的容易一些,但是也并不代表说你什么都不下工夫就可以发表。优助医学认为,SCI发表的难易,应该以工作量来计算,最小工作量的需求来源于医生做科研时既经费局促又精力不足的窘境,基础条件很差的索性都去发META和临床研究的文章了。常规套路是细胞加上动物模型的实验,SCI,5分与1分的区别在于对临床资料各种分层分析的结果,以及获得有意义的结论。这一类研究,核心数据是三表一图:1)基线表;2)单因素表;3)多因素表;4)ROC曲线或者生存曲线图
ROC曲线指受试者工作特征曲线(receiver operating characteristic curve), 是反映敏感性和特异性连续变量的综合指标,是用
ROC曲线可以衡量分类器的准确性和灵敏度,具有重要的应用价值。 1.理解ROC曲线的基本概念 ROC(Receiver Operating Characteri
ROC曲线以真阳性率为纵坐标,以假阳性率为横坐标(1-特异度),,这样子ROC曲线越靠近左上角,试验的准确性就越高。最靠近左上角的ROC曲线的点是错误最少的最好
教授,博士生导师 医学博士,泌尿外科专家,《中华医学杂志》副总编辑。他坚持临床与科研并重,临床第一的学科发展理念,擅长泌尿系肿瘤、结石、男性学、前列腺外科、微创
柱状图用于较小的数据集分析。 折线图用于显示在相等时间间隔下数据的趋势。 柱状图: 1、定义: 柱状图也就是条形统计图,类似的图形表达为直方图,不过后者较柱状图