Aan de slagBegin gratis

Kies de juiste data voor survival-analyse

Stel, je werkt aan het schatten van de snelheid waarmee een nieuwe virusvariant zich in een populatie verspreidt. Het is altijd goed om eerst de beschikbare data te verkennen voordat je beslist of je een statistisch model gebruikt. Let op de aannames van het model en de vereisten voor de data.

Er zijn drie datasets voor je geladen, genaamd

  • virus_record_a
  • virus_record_b
  • virus_record_c

Inspecteer elke DataFrame in de console. Welke van de DataFrames zijn geschikt voor survival-analyse?

pandas en numpy zijn respectievelijk geladen als pd en np.

Deze oefening maakt deel uit van de cursus

Survivalanalyse in Python

Bekijk cursus

Interactieve oefening met praktijkervaring

Zet theorie om in actie met een van onze interactieve oefeningen

Begin oefening