LoslegenKostenlos loslegen

Übung: Zensierung ignorieren

Du gibst eine Party, und um 1 Uhr nachts fangen die Gäste plötzlich an zu tanzen. Du willst analysieren, wie lange deine Gäste tanzen, und beginnst Daten zu sammeln. Das Problem: Du wirst müde und gehst nach einer Weile ins Bett.

Du hast die folgenden rechtszensierten Tanzzeiten im Datensatz dancedat:

  • name ist der Name deines Freundes.
  • time ist die rechtszensierte Tanzzeit.
  • obs_end gibt an, ob du das Ende des Tanzes deiner Freunde beobachtet hast (1) oder ob du eingeschlafen bist, bevor sie aufgehört haben zu tanzen (0).

Du beginnst am Morgen mit der Analyse, bist aber noch müde und ignorierst zunächst die Tatsache, dass du zensierte Beobachtungen hast. Dann erinnerst du dich an diesen Kurs auf DataCamp und machst es korrekt.

Das Paket survival ist in dieser Übung bereits geladen.

Diese Übung ist Teil des Kurses

Survival-Analyse in R

Kurs anzeigen

Anleitung zur Übung

  • Schätze die Überlebensfunktion so, als wären alle zensierten Beobachtungen tatsächlich beobachtet worden.
  • Schätze die Überlebensfunktion aus diesem Datensatz mit Kaplan–Meier.
  • Plotte die richtige und die falsche Überlebenskurve mit ggsurvplot_combine() und vergleiche sie. Achte darauf, wie sie sich unterscheiden.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Create dancedat data
dancedat <- data.frame(
  name = c("Chris", "Martin", "Conny", "Desi", "Reni", "Phil", 
    "Flo", "Andrea", "Isaac", "Dayra", "Caspar"),
  time = c(20, 2, 14, 22, 3, 7, 4, 15, 25, 17, 12),
  obs_end = c(1, 1, 0, 1, 1, 1, 1, 1, 0, 0, 0))

# Estimate the survivor function pretending that all censored observations are actual observations.
km_wrong <- survfit(___(time) ~ 1, data = dancedat)

# Estimate the survivor function from this dataset via kaplan-meier.
km <- survfit(___(___, ___) ~ ___, data = dancedat)

# Plot the two and compare
ggsurvplot_combine(list(correct = ___, wrong = ___))
Code bearbeiten und ausführen