生存分析基础与删失问题

需积分: 9 150 浏览量更新于2024-11-25 收藏 388KB PDF 举报

"基本生存分析入门教程" 生存分析是一种统计学方法，主要研究事件发生之间的时间间隔，通常称为生存时间或失效时间。这种分析在多种领域都有应用，例如医学研究中的寿命研究、疾病诊断后的生存期，或者产品寿命分析等。生存分析关注的是一个特定事件发生的时间点，如人的死亡、疾病的首次诊断、治疗后到复发的时间等。生存分析的一个关键挑战是 censoring（截尾）问题。截尾数据是指在研究结束时，部分个体的生存时间并未完全观察到。这可能是因为失去随访、参与者退出研究或研究本身有时间限制等原因。在图示的例子中，右截尾表示个体的生存时间超过了观察结束的时间点，如图中的"T>240"、"T>150"和"T>380"，这意味着这些个体在研究结束时尚未发生事件，但确切的生存时间未知。以一个具体的例子来说明，来自 Kalbﬂeish 和 Prentice (1980) 的数据展示了从给予致癌物质 DMBA 到大鼠死于阴道癌的时间。数据分为两个组，每个组的生存时间以天为单位给出。这个例子揭示了生存分析在生物学实验中的应用，不同的预处理条件可能影响动物对致癌物质的反应时间和致死率。生存分析的基本目标是估计生存时间的分布，并分析影响生存时间的因素。常用的方法包括 Kaplan-Meier 生存曲线、Cox 比例风险模型等。Kaplan-Meier 曲线可以非参数地展示不同群体的生存概率，而 Cox 模型则考虑了多个协变量对生存时间的影响，允许我们在控制其他变量的情况下研究某个因素对生存时间的相对风险。生存分析还包括对截尾数据的处理，如逆概率加权法（Inverse Probability of Censoring Weights, IPCW）和倾向得分匹配（Propensity Score Matching, PSM），以及评估预后因子和预测模型的构建。此外，为了更深入地理解生存数据，可以使用 frailty 模型来考虑个体之间的异质性，或者采用时间依赖的协变量分析动态变化的影响。生存分析是一个复杂但强大的工具，用于研究和解释事件发生的时间过程。它不仅适用于医学研究，还广泛应用于金融、工程、社会学等多个领域，帮助研究人员理解和预测各种类型的时间至事件数据。

Basic Survival Analysis

Ivan Iachine

iachine@statdem.sdu.dk

Biostatistik - Basale Begreber

Revision 2.11, 14.11.01

Survival Analysis:

Study of Durations Between Events

Outcome: T - time until an event occurs,

“survival time” or “failure time”

Study start Study end

Time, days

100 200 300

T = 240

T = 150

T = 310

Examples:

-Age at death

-Age at ﬁrst disease diagnosis

-Waiting time to pregnancy

-Duration between treatment and death

The Censoring Problem in Survival Analysis:

Censoring:

Incomplete observations of the survival time.

Right censoring:

Some individuals may not be observed for the

full time to failure, e.g. because of:

• Loss to follow-up

• Drop out

• Termination of the study

Study start Study end

Time, days

100 200 300

o x

T > 240

o x

T > 150

T = 310

o x

T > 380

Example:

From Kalbﬂeish and Prentice (1980), p.1:

”Table 1.1, from Pike (1966), gives the times

from insult with the carcinogen DMBA to

mortality from vaginal cancer in rats. Two

groups were distinguished by a pretreatment

regime.” (The times are in days)

Group 1:

143, 164, 188, 188, 190, 192, 206, 209,

213, 216, 220, 227, 230, 234, 246, 265, 304,

216+, 244+

Group 2:

142, 156, 163, 198, 205, 232, 232, 233, 233,

233, 233, 239, 240, 261, 280, 280, 296, 296,

323, 204+, 344+

+Censored

下载后可阅读完整内容，剩余8页未读，立即下载

a_kong

粉丝: 0
资源: 1

生存分析基础与删失问题

An Introduction to Statistics with Python(Springer,2016)

propability-design2.rar_数学计算_Visual_Basic_

Optimization of Medical Data Analysis with MATLAB: Practical Applications of Optimization Algorithms

Financial Model Optimization Using MATLAB's Genetic Algorithm: Strategy Analysis and Maximizing ...

MATLAB Genetic Algorithm Coding and Operations: In-depth Analysis of Crossover and Mutation

基于springboot+vue的体育馆管理系统的设计与实现（Java毕业设计，附源码，部署教程）.zip

二叉树的创建，打印，交换左右子树，层次遍历，先中后遍历，计算树的高度和叶子节点个数

鸿蒙操作系统接入智能卡读写器SDK范例

【天线】基于matlab时域差分FDTD方法喇叭天线仿真（绘制电场方向图）【含Matlab源码 9703期】.zip

QT 下拉菜单设置参数 起始端口和结束端口

最新资源

QT 下拉菜单设置参数起始端口和结束端口