Aan de slagGa gratis aan de slag

Kies de juiste data voor survival-analyse

Stel, je werkt aan het schatten van de snelheid waarmee een nieuwe virusvariant zich in een populatie verspreidt. Het is altijd goed om eerst de beschikbare data te verkennen voordat je beslist of je een statistisch model gebruikt. Let op de aannames van het model en de vereisten voor de data.

Er zijn drie datasets voor je geladen, genaamd

  • virus_record_a
  • virus_record_b
  • virus_record_c

Inspecteer elke DataFrame in de console. Welke van de DataFrames zijn geschikt voor survival-analyse?

pandas en numpy zijn respectievelijk geladen als pd en np.

Deze oefening maakt deel uit van de cursus

Survivalanalyse in Python

Cursus bekijken

Praktische interactieve oefening

Zet theorie om in actie met een van onze interactieve oefeningen.

Begin met trainen