如何构建Cox回归预测模型并绘制列线图

2021-10-9 来源:本站原创 浏览次数:

临沂白癜风医院 http://news.39.net/bjzkhbzy/171023/5784188.html
编者按:临床预测模型作为临床研究的“高阶玩法”,不仅仅是发表高分SCI文章的热门选择,更是改变临床实践的重要途径。随着临床预测模型热度日渐上升,很多团队都在尝试建立各类疾病诊断/治疗的预测模型,但经常遭遇准确性低或应用不便等“拦路虎”。在此背景下,《临床预测模型构建方法学》应运而生。本书由30余位临床统计高手合力编著而成,是一本拿来即用的“实战指南”。在新书热销之际,AME科研时间将节选部分精彩篇章以飨读者。今天带来“基于Cox回归构建预测模型与绘制列线图”一章。本章主要探讨应在什么情况下去选择Cox比例风险模型,并以真实案例演示生存资料结局的列线图如何绘制。基于Cox回归构建预测模型与绘制列线图

周支瑞,王巍炜,王绍佳,金恺睿,李博,张天嵩

一、背景知识

人类对于“算命”这样的事情总是乐此不疲,无论是中国文化中“算命占卜”还是西方文化中的“占星术”,无不说明人们对于此道的热衷。本章所讨论的用于评估患者预后的预测模型构建也是一种“算命”,只不过这是一种更为科学的“算命”。笔者作为一个肿瘤科医生,临床上时常会遇到这样的情况,一位60多岁中晚期男性食管癌患者问道:“医生,请问我还能活多久?”这是一个令人揪心的问题,大多数时候我会根据患者的临床分期告诉患者,这种情况的中位生存时间是多少。其实这里的临床分期就是我们预测患者期望寿命的依据,或者如本文标题所说的“预测模型”。我们用某一临床分期的所有患者中位生存时间来回答单个患者的具体生存时间的问题,可能会存在问题,因为这里的中位生存时间代表的是患者群体预期寿命的平均值,对于具体的个体来说有时并不准确。没人能说得清楚这个患者到底是预后良好的那一半还是预后不好的那一半[1-2]。

那是否有更科学、更准确的方法计算出每个患者的生存概率呢?答案是肯定的。我们可以通过Cox比例风险模型等方法先构建一个数学模型,然后根据这个模型参数把患者的生存概率可视化为Nomogram图,根据此图准确计算每个患者的生存概率。Nomogram中文常翻译为诺模图或列线图,其本质就是回归方程的可视化。它根据所有自变量回归系数的大小来制订评分标准,据此给每个自变量的每种取值水平一个评分,这样对每个患者就可以计算得到一个总分,再通过总分与结局发生概率之间的转换函数来计算每个患者的结局发生概率。举例来说,我们治疗了一个40岁的男性胰腺癌手术后的患者,术中进行了放疗,肿瘤位于胰腺头部,有腹膜转移,临床分期在Ⅳ期。根据上述条件,通过一定的数学模型判断每个变量的得分,比如年龄40岁,得分是10分,男性得分是4分……依次累计各个变量的得分,计算出总分,不同的总分值就对应3个月、6个月和1年的生存概率。复杂的Cox回归公式变成了直观的图形,医生可以很方便地计算每个患者的生存概率,从而告知患者一个相对准确的“算命”结果。在前一章Logistic回归模型列线图中,我们已经对此做出解释,Cox回归模型列线图的解释也是类似的[1-2]。

与上一章类似,什么情况下可以选择Cox比例风险模型?这其实是一个多因素回归分析方法选择的问题。如果我们的结局是生存结局,或者叫Timetoevent的生存资料,我们可以选择Cox比例风险模型。关于模型预测变量的筛选原则请参考第二章所述变量筛选基本原则。同样需要注意,一方面要权衡样本量与纳入模型的自变量个数,另一方面也要权衡模型准确度与模型使用的简便性确定最终进入预测模型的变量个数。下面就以真实案例演示生存资料结局的列线图如何绘制,以下2个案例分析重点在于R语言的操作,具体的统计学原理不作为重点阐释。

二、案例1分析

(一)案例1介绍

我们以[案例1]的数据,介绍生存资料预后模型的建立与Nomogram图形绘制。为了便于读者阅读与练习模仿,对数据进行了简化处理。笔者在Thecancergenomeatlas(TCGA)数据中下载例浸润性乳腺癌患者的临床资料(下载网址:

转载请注明:
http://www.whyxqt.com/yxays/113448.html
  • 上一篇文章:

  • 下一篇文章: 没有了
  • 网站首页 版权信息 发布优势 合作伙伴 隐私保护 服务条款 网站地图 网站简介
    医院地址: 健康热线:
    温馨提示:本站信息不能作为诊断和医疗依据
    版权所有 2014-2024
    今天是: