Statistische Analyse von Ereigniszeiten - Survival...

21
Analyse von Ereigniszeiten Werner Brannath Inhalt Überlebens- kurven Beispiel 1 Median Beispiel 2 Log-Rank- Test Hazard Statistische Analyse von Ereigniszeiten Survival Analysis Werner Brannath VO Biostatistik im WS 2006/2007

Transcript of Statistische Analyse von Ereigniszeiten - Survival...

Page 1: Statistische Analyse von Ereigniszeiten - Survival Analysishomepage.univie.ac.at/werner.brannath/BiostatVO/SurvivalI_org.pdf · Survival. Analyse von Ereigniszeiten Werner Brannath

Analyse vonEreigniszeiten

WernerBrannath

Inhalt

Überlebens-kurvenBeispiel 1

Median

Beispiel 2

Log-Rank-Test

Hazard

Statistische Analysevon Ereigniszeiten

Survival Analysis

Werner Brannath

VO Biostatistik im WS 2006/2007

Page 2: Statistische Analyse von Ereigniszeiten - Survival Analysishomepage.univie.ac.at/werner.brannath/BiostatVO/SurvivalI_org.pdf · Survival. Analyse von Ereigniszeiten Werner Brannath

Analyse vonEreigniszeiten

WernerBrannath

Inhalt

Überlebens-kurvenBeispiel 1

Median

Beispiel 2

Log-Rank-Test

Hazard

Inhalt

1 Überlebenskurven

2 Log-Rank-Test

3 Hazard

Page 3: Statistische Analyse von Ereigniszeiten - Survival Analysishomepage.univie.ac.at/werner.brannath/BiostatVO/SurvivalI_org.pdf · Survival. Analyse von Ereigniszeiten Werner Brannath

Analyse vonEreigniszeiten

WernerBrannath

Inhalt

Überlebens-kurvenBeispiel 1

Median

Beispiel 2

Log-Rank-Test

Hazard

Beispiel 1: Leukemiedaten (unzensiert)

33 Patienten mit Leukemie; Zielvariable Überlebenszeit.

Alle Patienten verstorben und Überlebenszeit (Wochen)für alle Patienten bekannt. → keine Zensierung!

Lebensdauer eines Patienten typischerweise nichtnormalverteilt; Verteilung ist in der Regel schief.

Berechnen für jeden Zeitpunkt t den Anteil derlebenden Patienten:

S(t) =Zahl der Individuen mit Überlebenszeit ≥ t

Zahl aller Individuen im Datensatz

Verwenden typischerweise Median statt Mittelwert.

Page 4: Statistische Analyse von Ereigniszeiten - Survival Analysishomepage.univie.ac.at/werner.brannath/BiostatVO/SurvivalI_org.pdf · Survival. Analyse von Ereigniszeiten Werner Brannath

Analyse vonEreigniszeiten

WernerBrannath

Inhalt

Überlebens-kurvenBeispiel 1

Median

Beispiel 2

Log-Rank-Test

Hazard

Beispiel 1: Leukemiedaten (unzensiert)

> leuk.surv<-survfit(Surv(surv),data=leuk)> summary(leuk.surv)

time n.risk n.event survival std.err lower 95% CI upper 95% CI1 33 2 0.9394 0.0415 0.8614 1.0002 31 1 0.9091 0.0500 0.8161 1.0003 30 3 0.8182 0.0671 0.6966 0.9614 27 4 0.6970 0.0800 0.5566 0.8735 23 1 0.6667 0.0821 0.5238 0.8497 22 1 0.6364 0.0837 0.4917 0.8248 21 1 0.6061 0.0851 0.4603 0.79816 20 2 0.5455 0.0867 0.3995 0.74517 18 1 0.5152 0.0870 0.3700 0.71722 17 2 0.4545 0.0867 0.3128 0.66126 15 1 0.4242 0.0860 0.2851 0.63130 14 1 0.3939 0.0851 0.2580 0.60139 13 1 0.3636 0.0837 0.2316 0.57143 12 1 0.3333 0.0821 0.2057 0.54056 11 2 0.2727 0.0775 0.1562 0.47665 9 3 0.1818 0.0671 0.0882 0.375

100 6 1 0.1515 0.0624 0.0676 0.340108 5 1 0.1212 0.0568 0.0484 0.304121 4 1 0.0909 0.0500 0.0309 0.267134 3 1 0.0606 0.0415 0.0158 0.232143 2 1 0.0303 0.0298 0.0044 0.209156 1 1 0.0000 NA NA NA

Page 5: Statistische Analyse von Ereigniszeiten - Survival Analysishomepage.univie.ac.at/werner.brannath/BiostatVO/SurvivalI_org.pdf · Survival. Analyse von Ereigniszeiten Werner Brannath

Analyse vonEreigniszeiten

WernerBrannath

Inhalt

Überlebens-kurvenBeispiel 1

Median

Beispiel 2

Log-Rank-Test

Hazard

Beispiel 1: Leukemiedaten (unzensiert)

0 50 100 150

0.0

0.2

0.4

0.6

0.8

1.0

Weeks

Sur

viva

l

Page 6: Statistische Analyse von Ereigniszeiten - Survival Analysishomepage.univie.ac.at/werner.brannath/BiostatVO/SurvivalI_org.pdf · Survival. Analyse von Ereigniszeiten Werner Brannath

Analyse vonEreigniszeiten

WernerBrannath

Inhalt

Überlebens-kurvenBeispiel 1

Median

Beispiel 2

Log-Rank-Test

Hazard

Beispiel 1: Leukemiedaten (unzensiert)

> leuk.survn events median 0.95LCL 0.95UCL

33 33 22 7 56

0 50 100 150

0.0

0.2

0.4

0.6

0.8

1.0

Weeks

Sur

viva

l

7 22 56

0.5

Page 7: Statistische Analyse von Ereigniszeiten - Survival Analysishomepage.univie.ac.at/werner.brannath/BiostatVO/SurvivalI_org.pdf · Survival. Analyse von Ereigniszeiten Werner Brannath

Analyse vonEreigniszeiten

WernerBrannath

Inhalt

Überlebens-kurvenBeispiel 1

Median

Beispiel 2

Log-Rank-Test

Hazard

Konfidenzintervall für Median

tm wahre mediane Überlebenszeit

(d.h. S(tm) = 0.5, S(t) wahre Überlebenswahrscheinlichkeit)

So(t) sei obere 95%-Konfidenzschranke für S(t)

(d.h. P[So(t) ≥ S(t)] ≥ 0.975)

Obere Konfidenzschranke für Median ist Zeitpunkt to mitSo(to) = 0.5, denn

P[tm ≤ to] = P[So(tm) ≥ So (to)︸ ︷︷ ︸=0.5

] = P[So(tm) ≥ S(tm)︸ ︷︷ ︸=0.5

] ≥ 0.975

Page 8: Statistische Analyse von Ereigniszeiten - Survival Analysishomepage.univie.ac.at/werner.brannath/BiostatVO/SurvivalI_org.pdf · Survival. Analyse von Ereigniszeiten Werner Brannath

Analyse vonEreigniszeiten

WernerBrannath

Inhalt

Überlebens-kurvenBeispiel 1

Median

Beispiel 2

Log-Rank-Test

Hazard

Beispiel 2: Prostata-Daten (zensiert)

Randomisierte Studie zum Vergleich vonDiethylstilbestrol (DES) mit Plazebo zur Behandlungenvon Prostatakrebs.

Die Zielvariable ist die Zeit zwischen Behandlung undTod oder Studienende.Bei Patienten die bis zum Ende der Studie überleben,kann die vollständige Lebensdauer nicht festgestelltwerden → rechtszensierte Daten

Fragestellung: Verlängert die Behandlung mit DES dieÜberlebensdauer von Patienten mit Prostatakrebs?

Page 9: Statistische Analyse von Ereigniszeiten - Survival Analysishomepage.univie.ac.at/werner.brannath/BiostatVO/SurvivalI_org.pdf · Survival. Analyse von Ereigniszeiten Werner Brannath

Analyse vonEreigniszeiten

WernerBrannath

Inhalt

Überlebens-kurvenBeispiel 1

Median

Beispiel 2

Log-Rank-Test

Hazard

Beispiel 2: Prostata-Daten (zensiert)

PatNr. Treatment Time Status1 1 65 02 2 61 03 2 60 04 1 58 05 2 51 06 1 51 07 1 14 18 1 43 09 2 16 0

10 1 52 011 1 59 012 2 55 013 2 68 014 2 51 015 1 2 016 1 67 017 2 66 018 2 66 019 2 28 0

PatNr. Treatment Time Status20 2 50 121 1 69 122 1 67 023 2 65 024 1 24 025 2 45 026 2 64 027 1 61 028 1 26 129 1 42 130 2 57 031 2 70 032 2 5 033 2 54 034 1 36 135 2 70 036 2 67 037 1 23 038 1 62 0

Page 10: Statistische Analyse von Ereigniszeiten - Survival Analysishomepage.univie.ac.at/werner.brannath/BiostatVO/SurvivalI_org.pdf · Survival. Analyse von Ereigniszeiten Werner Brannath

Analyse vonEreigniszeiten

WernerBrannath

Inhalt

Überlebens-kurvenBeispiel 1

Median

Beispiel 2

Log-Rank-Test

Hazard

Beispiel 2: Kaplan-Meier Kurven

0 10 20 30 40 50 60 70

0.0

0.2

0.4

0.6

0.8

1.0

Time since start of treatment (month)

Sur

viva

l pro

babi

lity

PlaceboDES

Page 11: Statistische Analyse von Ereigniszeiten - Survival Analysishomepage.univie.ac.at/werner.brannath/BiostatVO/SurvivalI_org.pdf · Survival. Analyse von Ereigniszeiten Werner Brannath

Analyse vonEreigniszeiten

WernerBrannath

Inhalt

Überlebens-kurvenBeispiel 1

Median

Beispiel 2

Log-Rank-Test

Hazard

Beispiel 2: Kaplan-Meier Kurven

> summary(survfit(Surv(Time,Status)~Treatment,data=prostate,>+ conf.type=’none’,se.fit=F))

Treatment=1 Treatment=2time n.risk n.event survival time n.risk n.event survival

14 17 1 0.941 50 16 1 0.937526 14 1 0.87436 13 1 0.80742 12 1 0.73969 1 1 0.000

Page 12: Statistische Analyse von Ereigniszeiten - Survival Analysishomepage.univie.ac.at/werner.brannath/BiostatVO/SurvivalI_org.pdf · Survival. Analyse von Ereigniszeiten Werner Brannath

Analyse vonEreigniszeiten

WernerBrannath

Inhalt

Überlebens-kurvenBeispiel 1

Median

Beispiel 2

Log-Rank-Test

Hazard

Kaplan-Meier-Kurve

Kaplan-Meier-Kurve für Gruppe k

time: t1 ≤ t2 ≤ · · · ≤ tn geordnete Ereignis-Zeitpunkten.risk: Zahl rkj der Ind. unter Risiko unmittelbar vor tjn.event: Zahl dkj der Ereignisse im Zeitpunkt tjsurvival: Kaplan-Meier-Kurve

Sk (t) = Πj:tj≤t

(1−

dkj

rkj

)

Page 13: Statistische Analyse von Ereigniszeiten - Survival Analysishomepage.univie.ac.at/werner.brannath/BiostatVO/SurvivalI_org.pdf · Survival. Analyse von Ereigniszeiten Werner Brannath

Analyse vonEreigniszeiten

WernerBrannath

Inhalt

Überlebens-kurvenBeispiel 1

Median

Beispiel 2

Log-Rank-Test

Hazard

Log-Rank-Test

Der Log-Rank-Test ist eine nicht-parametrischer Test

zum Vergleich von K Gruppen bezüglich einerEreigniszeit

mit der Null-Hypothese

H0 : Verteilung der Ereigniszeit in allen Gruppen gleich

ist auch gültig bei zensierten Daten(bei unzensierten Daten equivalent zum Savage-Test).

Page 14: Statistische Analyse von Ereigniszeiten - Survival Analysishomepage.univie.ac.at/werner.brannath/BiostatVO/SurvivalI_org.pdf · Survival. Analyse von Ereigniszeiten Werner Brannath

Analyse vonEreigniszeiten

WernerBrannath

Inhalt

Überlebens-kurvenBeispiel 1

Median

Beispiel 2

Log-Rank-Test

Hazard

Beispiel 2: Log-Rank-Test

> survdiff(Surv(Time,Status)~Treatment,data=prostate)

N Observed Expected (O-E)^2/E (O-E)^2/VTreatment=1 18 5 2.47 2.58 4.42Treatment=2 20 1 3.53 1.81 4.42

Chisq= 4.4 on 1 degrees of freedom, p= 0.0355

Page 15: Statistische Analyse von Ereigniszeiten - Survival Analysishomepage.univie.ac.at/werner.brannath/BiostatVO/SurvivalI_org.pdf · Survival. Analyse von Ereigniszeiten Werner Brannath

Analyse vonEreigniszeiten

WernerBrannath

Inhalt

Überlebens-kurvenBeispiel 1

Median

Beispiel 2

Log-Rank-Test

Hazard

Log-Rank-Test zum Vergleich von zweiGruppen k = 1, 2

t1 ≤ t2 ≤ · · · ≤ tn alle geordneten Ereigniszeitpunkte(d.h. von beiden Gruppen)

rj = r1j + r2j Gesamtzahl unter Risiko zum Zeitpkt. tj .

dj = d1j + d2j Gesamtzahl Ereignisse zum Zeitpkt. tj .

Unter H0 erwartete Zahl der Ereignisse in Gruppe kzum Zeitpunkt tj

Ekj = rkj ·dj

rj

Page 16: Statistische Analyse von Ereigniszeiten - Survival Analysishomepage.univie.ac.at/werner.brannath/BiostatVO/SurvivalI_org.pdf · Survival. Analyse von Ereigniszeiten Werner Brannath

Analyse vonEreigniszeiten

WernerBrannath

Inhalt

Überlebens-kurvenBeispiel 1

Median

Beispiel 2

Log-Rank-Test

Hazard

Log-Rank-Test zum Vergleich von zweiGruppen k = 1, 2

(O-E): Summe der Differenzen zwischen beobachteterund erwarteter Zahl an Ereignissen in Gruppe k

Uk =n∑

j=1

(Ekj − dkj)

V: Schätzer der Varianz von Uk

(Summe der Varianzen von dkj gegeben rj und dj )

(O-E)ˆ2/V bei zwei Gruppen und chisq i.a.:Teststatistik des Log-Rank-Tests

U21/V1 = U2

2/V2 ∼ χ2(df = 1)

Page 17: Statistische Analyse von Ereigniszeiten - Survival Analysishomepage.univie.ac.at/werner.brannath/BiostatVO/SurvivalI_org.pdf · Survival. Analyse von Ereigniszeiten Werner Brannath

Analyse vonEreigniszeiten

WernerBrannath

Inhalt

Überlebens-kurvenBeispiel 1

Median

Beispiel 2

Log-Rank-Test

Hazard

Hazard zum Zeitpunkt t

T die Zeit bis zum Ereignis (z.B. Tod).Die Hazard zum Zeitpunkt t is definiert als

h(t) = lims→0

1s

P(t ≤ T ≤ t + s |T ≥ t)

Wenn das Zeitintervall [t , t + s] sehr kurz ist, dann ist

h(t) · s ≈ P(t ≤ T ≤ t + s |T ≥ t)

die bedingte Wahrscheinlichkeit, dass das Ereignis imZeitintervall [t , t + s] stattfindet gegeben, dass dasEreignis nicht schon vor t stattgefunden hat.

Page 18: Statistische Analyse von Ereigniszeiten - Survival Analysishomepage.univie.ac.at/werner.brannath/BiostatVO/SurvivalI_org.pdf · Survival. Analyse von Ereigniszeiten Werner Brannath

Analyse vonEreigniszeiten

WernerBrannath

Inhalt

Überlebens-kurvenBeispiel 1

Median

Beispiel 2

Log-Rank-Test

Hazard

Hazardfunktion

Die Hazardfunktion λ(t) zeigt, wie sich das Risiko fürdas Ereignis im Laufe der Zeit verändert:

ist λ(t) in t konstant, so bleibt das Risiko über die Zeitkonstant;steigt (fällt) λ(t) mit der Zeit, so steigt (fällt) das Risikomit der Zeit.

Bedingen auf T ≥ t in der Def. der Hazard ist wichtig:

unbedingte Wahrsch. mit 100 J. zu sterben ist klein, dadie Wahrsch. 100 zu werden ebenfalls klein ist;bedingt darauf 100 geworden zu sein, ist die Wahrsch.mit 100 zu sterben jedoch groß (jedenfalls grösser alsz.B. mit 30 zu sterben gegeben 30 geworden zu sein).

Page 19: Statistische Analyse von Ereigniszeiten - Survival Analysishomepage.univie.ac.at/werner.brannath/BiostatVO/SurvivalI_org.pdf · Survival. Analyse von Ereigniszeiten Werner Brannath

Analyse vonEreigniszeiten

WernerBrannath

Inhalt

Überlebens-kurvenBeispiel 1

Median

Beispiel 2

Log-Rank-Test

Hazard

Kummulierte Hazardfunktion

Integrierte bzw. kummulierte Hazardfunktion:

H(t) =

∫ t

0h(u) du

Die kummulierte Hazardfunktion bestimmt dieÜberlebenswahrscheinlichkeiten:

S(t) = P(T > t) = exp{−H(t)}

Page 20: Statistische Analyse von Ereigniszeiten - Survival Analysishomepage.univie.ac.at/werner.brannath/BiostatVO/SurvivalI_org.pdf · Survival. Analyse von Ereigniszeiten Werner Brannath

Analyse vonEreigniszeiten

WernerBrannath

Inhalt

Überlebens-kurvenBeispiel 1

Median

Beispiel 2

Log-Rank-Test

Hazard

Schätzung der Hazard- und kummuliertenHazardfunktion

Schätzung der Hazardfunktion (wird sehr selten verwendet)

h(tj) =1

tj+1 − ttj·

dj

rj

Nelson-Aalen-Schätzer der kummulierten Hazardfunktion

HNA(t) =∑j:tj≤t

h(tj) · (tj+1 − ttj ) =∑j:tj≤t

dj

rj

Breslow-Schätzer der Überlebensfunktion

SB(t) = exp{−HNA(t)}

(Alternative zum K.-M.-Schätzer; wird selten verwendet)

Page 21: Statistische Analyse von Ereigniszeiten - Survival Analysishomepage.univie.ac.at/werner.brannath/BiostatVO/SurvivalI_org.pdf · Survival. Analyse von Ereigniszeiten Werner Brannath

Analyse vonEreigniszeiten

WernerBrannath

Inhalt

Überlebens-kurvenBeispiel 1

Median

Beispiel 2

Log-Rank-Test

Hazard

Beispiel 1: Leukemiedaten – Placebo-Gruppe

0 10 20 30 40 50 60 70

0.0

0.2

0.4

0.6

0.8

1.0

1.2

Time

Inte

grat

ed H

azar

d

0 10 20 30 40 50 60 70

0.0

0.1

0.2

0.3

0.4

0.5

Time

Haz

ard