Aan de slagGa gratis aan de slag

Oefening waarbij censoring wordt genegeerd

Je geeft een feestje en om 1 uur ’s nachts begint iedereen ineens te dansen. Je bent benieuwd hoe lang je gasten blijven dansen en begint data te verzamelen. Het probleem is dat jij moe wordt en na een tijdje naar bed gaat.

Je hebt de volgende rechtsgecensureerde danstijden in dancedat:

  • name is de naam van je vriend(in).
  • time is de rechtsgecensureerde danstijd.
  • obs_end geeft aan of je het einde van de dans van je vriend(in) hebt gezien (1) of dat je ging slapen voordat die stopte met dansen (0).

Je gaat ’s ochtends met de data aan de slag, maar je bent moe en negeert in eerste instantie dat je geobserveerde waarden gecensureerd zijn. Dan herinner je je deze cursus op DataCamp en pak je het goed aan.

Het pakket survival is voor je geladen in deze oefening.

Deze oefening maakt deel uit van de cursus

Survivalanalyse in R

Cursus bekijken

Oefeninstructies

  • Schat de overlevingsfunctie door te doen alsof alle gecensureerde observaties echte gebeurtenissen zijn.
  • Schat de overlevingsfunctie voor deze gegevens met Kaplan-Meier.
  • Plot de juiste en de foutieve overlevingscurven allebei met ggsurvplot_combine() en vergelijk ze. Let op hoe ze verschillen.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Create dancedat data
dancedat <- data.frame(
  name = c("Chris", "Martin", "Conny", "Desi", "Reni", "Phil", 
    "Flo", "Andrea", "Isaac", "Dayra", "Caspar"),
  time = c(20, 2, 14, 22, 3, 7, 4, 15, 25, 17, 12),
  obs_end = c(1, 1, 0, 1, 1, 1, 1, 1, 0, 0, 0))

# Estimate the survivor function pretending that all censored observations are actual observations.
km_wrong <- survfit(___(time) ~ 1, data = dancedat)

# Estimate the survivor function from this dataset via kaplan-meier.
km <- survfit(___(___, ___) ~ ___, data = dancedat)

# Plot the two and compare
ggsurvplot_combine(list(correct = ___, wrong = ___))
Code bewerken en uitvoeren