Statistische Analyse von Ereigniszeiten - Survival...
Embed Size (px)
Transcript of Statistische Analyse von Ereigniszeiten - Survival...

Analyse vonEreigniszeiten
WernerBrannath
Inhalt
Überlebens-kurvenBeispiel 1
Median
Beispiel 2
Log-Rank-Test
Hazard
Statistische Analysevon Ereigniszeiten
Survival Analysis
Werner Brannath
VO Biostatistik im WS 2006/2007

Analyse vonEreigniszeiten
WernerBrannath
Inhalt
Überlebens-kurvenBeispiel 1
Median
Beispiel 2
Log-Rank-Test
Hazard
Inhalt
1 Überlebenskurven
2 Log-Rank-Test
3 Hazard

Analyse vonEreigniszeiten
WernerBrannath
Inhalt
Überlebens-kurvenBeispiel 1
Median
Beispiel 2
Log-Rank-Test
Hazard
Beispiel 1: Leukemiedaten (unzensiert)
33 Patienten mit Leukemie; Zielvariable Überlebenszeit.
Alle Patienten verstorben und Überlebenszeit (Wochen)für alle Patienten bekannt. → keine Zensierung!
Lebensdauer eines Patienten typischerweise nichtnormalverteilt; Verteilung ist in der Regel schief.
Berechnen für jeden Zeitpunkt t den Anteil derlebenden Patienten:
S(t) =Zahl der Individuen mit Überlebenszeit ≥ t
Zahl aller Individuen im Datensatz
Verwenden typischerweise Median statt Mittelwert.

Analyse vonEreigniszeiten
WernerBrannath
Inhalt
Überlebens-kurvenBeispiel 1
Median
Beispiel 2
Log-Rank-Test
Hazard
Beispiel 1: Leukemiedaten (unzensiert)
> leuk.surv<-survfit(Surv(surv),data=leuk)> summary(leuk.surv)
time n.risk n.event survival std.err lower 95% CI upper 95% CI1 33 2 0.9394 0.0415 0.8614 1.0002 31 1 0.9091 0.0500 0.8161 1.0003 30 3 0.8182 0.0671 0.6966 0.9614 27 4 0.6970 0.0800 0.5566 0.8735 23 1 0.6667 0.0821 0.5238 0.8497 22 1 0.6364 0.0837 0.4917 0.8248 21 1 0.6061 0.0851 0.4603 0.79816 20 2 0.5455 0.0867 0.3995 0.74517 18 1 0.5152 0.0870 0.3700 0.71722 17 2 0.4545 0.0867 0.3128 0.66126 15 1 0.4242 0.0860 0.2851 0.63130 14 1 0.3939 0.0851 0.2580 0.60139 13 1 0.3636 0.0837 0.2316 0.57143 12 1 0.3333 0.0821 0.2057 0.54056 11 2 0.2727 0.0775 0.1562 0.47665 9 3 0.1818 0.0671 0.0882 0.375
100 6 1 0.1515 0.0624 0.0676 0.340108 5 1 0.1212 0.0568 0.0484 0.304121 4 1 0.0909 0.0500 0.0309 0.267134 3 1 0.0606 0.0415 0.0158 0.232143 2 1 0.0303 0.0298 0.0044 0.209156 1 1 0.0000 NA NA NA

Analyse vonEreigniszeiten
WernerBrannath
Inhalt
Überlebens-kurvenBeispiel 1
Median
Beispiel 2
Log-Rank-Test
Hazard
Beispiel 1: Leukemiedaten (unzensiert)
0 50 100 150
0.0
0.2
0.4
0.6
0.8
1.0
Weeks
Sur
viva
l

Analyse vonEreigniszeiten
WernerBrannath
Inhalt
Überlebens-kurvenBeispiel 1
Median
Beispiel 2
Log-Rank-Test
Hazard
Beispiel 1: Leukemiedaten (unzensiert)
> leuk.survn events median 0.95LCL 0.95UCL
33 33 22 7 56
0 50 100 150
0.0
0.2
0.4
0.6
0.8
1.0
Weeks
Sur
viva
l
7 22 56
0.5

Analyse vonEreigniszeiten
WernerBrannath
Inhalt
Überlebens-kurvenBeispiel 1
Median
Beispiel 2
Log-Rank-Test
Hazard
Konfidenzintervall für Median
tm wahre mediane Überlebenszeit
(d.h. S(tm) = 0.5, S(t) wahre Überlebenswahrscheinlichkeit)
So(t) sei obere 95%-Konfidenzschranke für S(t)
(d.h. P[So(t) ≥ S(t)] ≥ 0.975)
→
Obere Konfidenzschranke für Median ist Zeitpunkt to mitSo(to) = 0.5, denn
P[tm ≤ to] = P[So(tm) ≥ So (to)︸ ︷︷ ︸=0.5
] = P[So(tm) ≥ S(tm)︸ ︷︷ ︸=0.5
] ≥ 0.975

Analyse vonEreigniszeiten
WernerBrannath
Inhalt
Überlebens-kurvenBeispiel 1
Median
Beispiel 2
Log-Rank-Test
Hazard
Beispiel 2: Prostata-Daten (zensiert)
Randomisierte Studie zum Vergleich vonDiethylstilbestrol (DES) mit Plazebo zur Behandlungenvon Prostatakrebs.
Die Zielvariable ist die Zeit zwischen Behandlung undTod oder Studienende.Bei Patienten die bis zum Ende der Studie überleben,kann die vollständige Lebensdauer nicht festgestelltwerden → rechtszensierte Daten
Fragestellung: Verlängert die Behandlung mit DES dieÜberlebensdauer von Patienten mit Prostatakrebs?

Analyse vonEreigniszeiten
WernerBrannath
Inhalt
Überlebens-kurvenBeispiel 1
Median
Beispiel 2
Log-Rank-Test
Hazard
Beispiel 2: Prostata-Daten (zensiert)
PatNr. Treatment Time Status1 1 65 02 2 61 03 2 60 04 1 58 05 2 51 06 1 51 07 1 14 18 1 43 09 2 16 0
10 1 52 011 1 59 012 2 55 013 2 68 014 2 51 015 1 2 016 1 67 017 2 66 018 2 66 019 2 28 0
PatNr. Treatment Time Status20 2 50 121 1 69 122 1 67 023 2 65 024 1 24 025 2 45 026 2 64 027 1 61 028 1 26 129 1 42 130 2 57 031 2 70 032 2 5 033 2 54 034 1 36 135 2 70 036 2 67 037 1 23 038 1 62 0

Analyse vonEreigniszeiten
WernerBrannath
Inhalt
Überlebens-kurvenBeispiel 1
Median
Beispiel 2
Log-Rank-Test
Hazard
Beispiel 2: Kaplan-Meier Kurven
0 10 20 30 40 50 60 70
0.0
0.2
0.4
0.6
0.8
1.0
Time since start of treatment (month)
Sur
viva
l pro
babi
lity
PlaceboDES

Analyse vonEreigniszeiten
WernerBrannath
Inhalt
Überlebens-kurvenBeispiel 1
Median
Beispiel 2
Log-Rank-Test
Hazard
Beispiel 2: Kaplan-Meier Kurven
> summary(survfit(Surv(Time,Status)~Treatment,data=prostate,>+ conf.type=’none’,se.fit=F))
Treatment=1 Treatment=2time n.risk n.event survival time n.risk n.event survival
14 17 1 0.941 50 16 1 0.937526 14 1 0.87436 13 1 0.80742 12 1 0.73969 1 1 0.000

Analyse vonEreigniszeiten
WernerBrannath
Inhalt
Überlebens-kurvenBeispiel 1
Median
Beispiel 2
Log-Rank-Test
Hazard
Kaplan-Meier-Kurve
Kaplan-Meier-Kurve für Gruppe k
time: t1 ≤ t2 ≤ · · · ≤ tn geordnete Ereignis-Zeitpunkten.risk: Zahl rkj der Ind. unter Risiko unmittelbar vor tjn.event: Zahl dkj der Ereignisse im Zeitpunkt tjsurvival: Kaplan-Meier-Kurve
Sk (t) = Πj:tj≤t
(1−
dkj
rkj
)

Analyse vonEreigniszeiten
WernerBrannath
Inhalt
Überlebens-kurvenBeispiel 1
Median
Beispiel 2
Log-Rank-Test
Hazard
Log-Rank-Test
Der Log-Rank-Test ist eine nicht-parametrischer Test
zum Vergleich von K Gruppen bezüglich einerEreigniszeit
mit der Null-Hypothese
H0 : Verteilung der Ereigniszeit in allen Gruppen gleich
ist auch gültig bei zensierten Daten(bei unzensierten Daten equivalent zum Savage-Test).

Analyse vonEreigniszeiten
WernerBrannath
Inhalt
Überlebens-kurvenBeispiel 1
Median
Beispiel 2
Log-Rank-Test
Hazard
Beispiel 2: Log-Rank-Test
> survdiff(Surv(Time,Status)~Treatment,data=prostate)
N Observed Expected (O-E)^2/E (O-E)^2/VTreatment=1 18 5 2.47 2.58 4.42Treatment=2 20 1 3.53 1.81 4.42
Chisq= 4.4 on 1 degrees of freedom, p= 0.0355

Analyse vonEreigniszeiten
WernerBrannath
Inhalt
Überlebens-kurvenBeispiel 1
Median
Beispiel 2
Log-Rank-Test
Hazard
Log-Rank-Test zum Vergleich von zweiGruppen k = 1, 2
t1 ≤ t2 ≤ · · · ≤ tn alle geordneten Ereigniszeitpunkte(d.h. von beiden Gruppen)
rj = r1j + r2j Gesamtzahl unter Risiko zum Zeitpkt. tj .
dj = d1j + d2j Gesamtzahl Ereignisse zum Zeitpkt. tj .
Unter H0 erwartete Zahl der Ereignisse in Gruppe kzum Zeitpunkt tj
Ekj = rkj ·dj
rj

Analyse vonEreigniszeiten
WernerBrannath
Inhalt
Überlebens-kurvenBeispiel 1
Median
Beispiel 2
Log-Rank-Test
Hazard
Log-Rank-Test zum Vergleich von zweiGruppen k = 1, 2
(O-E): Summe der Differenzen zwischen beobachteterund erwarteter Zahl an Ereignissen in Gruppe k
Uk =n∑
j=1
(Ekj − dkj)
V: Schätzer der Varianz von Uk
(Summe der Varianzen von dkj gegeben rj und dj )
(O-E)ˆ2/V bei zwei Gruppen und chisq i.a.:Teststatistik des Log-Rank-Tests
U21/V1 = U2
2/V2 ∼ χ2(df = 1)

Analyse vonEreigniszeiten
WernerBrannath
Inhalt
Überlebens-kurvenBeispiel 1
Median
Beispiel 2
Log-Rank-Test
Hazard
Hazard zum Zeitpunkt t
T die Zeit bis zum Ereignis (z.B. Tod).Die Hazard zum Zeitpunkt t is definiert als
h(t) = lims→0
1s
P(t ≤ T ≤ t + s |T ≥ t)
Wenn das Zeitintervall [t , t + s] sehr kurz ist, dann ist
h(t) · s ≈ P(t ≤ T ≤ t + s |T ≥ t)
die bedingte Wahrscheinlichkeit, dass das Ereignis imZeitintervall [t , t + s] stattfindet gegeben, dass dasEreignis nicht schon vor t stattgefunden hat.

Analyse vonEreigniszeiten
WernerBrannath
Inhalt
Überlebens-kurvenBeispiel 1
Median
Beispiel 2
Log-Rank-Test
Hazard
Hazardfunktion
Die Hazardfunktion λ(t) zeigt, wie sich das Risiko fürdas Ereignis im Laufe der Zeit verändert:
ist λ(t) in t konstant, so bleibt das Risiko über die Zeitkonstant;steigt (fällt) λ(t) mit der Zeit, so steigt (fällt) das Risikomit der Zeit.
Bedingen auf T ≥ t in der Def. der Hazard ist wichtig:
unbedingte Wahrsch. mit 100 J. zu sterben ist klein, dadie Wahrsch. 100 zu werden ebenfalls klein ist;bedingt darauf 100 geworden zu sein, ist die Wahrsch.mit 100 zu sterben jedoch groß (jedenfalls grösser alsz.B. mit 30 zu sterben gegeben 30 geworden zu sein).

Analyse vonEreigniszeiten
WernerBrannath
Inhalt
Überlebens-kurvenBeispiel 1
Median
Beispiel 2
Log-Rank-Test
Hazard
Kummulierte Hazardfunktion
Integrierte bzw. kummulierte Hazardfunktion:
H(t) =
∫ t
0h(u) du
Die kummulierte Hazardfunktion bestimmt dieÜberlebenswahrscheinlichkeiten:
S(t) = P(T > t) = exp{−H(t)}

Analyse vonEreigniszeiten
WernerBrannath
Inhalt
Überlebens-kurvenBeispiel 1
Median
Beispiel 2
Log-Rank-Test
Hazard
Schätzung der Hazard- und kummuliertenHazardfunktion
Schätzung der Hazardfunktion (wird sehr selten verwendet)
h(tj) =1
tj+1 − ttj·
dj
rj
Nelson-Aalen-Schätzer der kummulierten Hazardfunktion
HNA(t) =∑j:tj≤t
h(tj) · (tj+1 − ttj ) =∑j:tj≤t
dj
rj
Breslow-Schätzer der Überlebensfunktion
SB(t) = exp{−HNA(t)}
(Alternative zum K.-M.-Schätzer; wird selten verwendet)

Analyse vonEreigniszeiten
WernerBrannath
Inhalt
Überlebens-kurvenBeispiel 1
Median
Beispiel 2
Log-Rank-Test
Hazard
Beispiel 1: Leukemiedaten – Placebo-Gruppe
0 10 20 30 40 50 60 70
0.0
0.2
0.4
0.6
0.8
1.0
1.2
Time
Inte
grat
ed H
azar
d
0 10 20 30 40 50 60 70
0.0
0.1
0.2
0.3
0.4
0.5
Time
Haz
ard