8.13 生存分析
什么是生存?生存的意义很广泛,可以指人或动物的存活(相对
于死亡),可以是患者的病情正处于缓解状态(相对于再次复发或恶化),还可以是某个系统
或产品正常工作(相对于失效或故障),甚
至可是是客户的流失与否,等等。在生存分析中,研究的主要对象是
寿命超过某一时间的概率。还可以描述其他一些事情发生的概率,例
如产品的失效、出狱犯人第一次犯罪、失业人员第一次找到工作等。
在某些领域的分析中,经常用追踪的方式来研究事物的发展规律,比
如研究某种药物的疗效、手术后的存活时间、某件机器的使用寿命
等。
1.概念
生存分析是对一个或多个非负随机变量进行统计推断,研究生存
现象和响应时间数据及其统计规律的一门学科。
生存分析是既考虑结果又考虑生存时间,并可充分利用截尾数据
所提供的不完全信息对生存时间的分布特征进行描述,对影响生存时
间的主要因素进行分析。
2.生存分析研究的内容
(1)描述生存过程
研究生存时间的分布特点,估计生存率及平均存活时间,绘制生
存曲线等,根据生存时间的长短可以估算出各个时点的生存率,并根
据生存率来估计中位生存时间,也可以根据生存曲线分析其生存特
点,一般使用 Kaplan-Meier 法和寿命表法。
(2)比较生存过程
可通过生存率及其标准误对各样本的生存率进行比较,以探讨各
组间的生存过程是否存在差异,一般使用 Log-rank 检验和 Breslow 检
验。(3)分析危险因素
通过生存分析模型来探讨影响生存时间和终点事件的保护因素和
不利因素、因素作用的大小及方向、相对危险度的大小,基本使用 Cox
回归模型。
(4)建立数学模型
建立最终的数学模型通过 Cox 回归模型完成。
3.生存分析对资料的基本要求
样本由随机抽样方法获得,要有一定的数量,死亡例数和比
例不能太少。
完整数据所占的比例不能太少,即截尾值不宜太多。
截尾值出现的原因无偏性,为防止偏性,经常对被截尾的研
究对象的年龄、职业、地区、病情轻重等情况进行分析。
生存时间尽可能精确。
缺项要尽量补齐。
4.生存资料的共同特点
蕴含结局和时间两个方面的信息。
结局为两分类事件。
一般通过随访收集得到,随访观察往往是从某统一时间点
(如入院或实施手术等某种处理措施后)开始,观察到某规定