Übung: Zensierung ignorieren
Du gibst eine Party, und um 1 Uhr nachts fangen die Gäste plötzlich an zu tanzen. Du willst analysieren, wie lange deine Gäste tanzen, und beginnst Daten zu sammeln. Das Problem: Du wirst müde und gehst nach einer Weile ins Bett.
Du hast die folgenden rechtszensierten Tanzzeiten im Datensatz dancedat:
nameist der Name deines Freundes.timeist die rechtszensierte Tanzzeit.obs_endgibt an, ob du das Ende des Tanzes deiner Freunde beobachtet hast (1) oder ob du eingeschlafen bist, bevor sie aufgehört haben zu tanzen (0).
Du beginnst am Morgen mit der Analyse, bist aber noch müde und ignorierst zunächst die Tatsache, dass du zensierte Beobachtungen hast. Dann erinnerst du dich an diesen Kurs auf DataCamp und machst es korrekt.
Das Paket survival ist in dieser Übung bereits geladen.
Diese Übung ist Teil des Kurses
Survival-Analyse in R
Anleitung zur Übung
- Schätze die Überlebensfunktion so, als wären alle zensierten Beobachtungen tatsächlich beobachtet worden.
- Schätze die Überlebensfunktion aus diesem Datensatz mit Kaplan–Meier.
- Plotte die richtige und die falsche Überlebenskurve mit
ggsurvplot_combine()und vergleiche sie. Achte darauf, wie sie sich unterscheiden.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Create dancedat data
dancedat <- data.frame(
name = c("Chris", "Martin", "Conny", "Desi", "Reni", "Phil",
"Flo", "Andrea", "Isaac", "Dayra", "Caspar"),
time = c(20, 2, 14, 22, 3, 7, 4, 15, 25, 17, 12),
obs_end = c(1, 1, 0, 1, 1, 1, 1, 1, 0, 0, 0))
# Estimate the survivor function pretending that all censored observations are actual observations.
km_wrong <- survfit(___(time) ~ 1, data = dancedat)
# Estimate the survivor function from this dataset via kaplan-meier.
km <- survfit(___(___, ___) ~ ___, data = dancedat)
# Plot the two and compare
ggsurvplot_combine(list(correct = ___, wrong = ___))