Kies de juiste data voor survival-analyse
Stel, je werkt aan het schatten van de snelheid waarmee een nieuwe virusvariant zich in een populatie verspreidt. Het is altijd goed om eerst de beschikbare data te verkennen voordat je beslist of je een statistisch model gebruikt. Let op de aannames van het model en de vereisten voor de data.
Er zijn drie datasets voor je geladen, genaamd
virus_record_avirus_record_bvirus_record_c
Inspecteer elke DataFrame in de console. Welke van de DataFrames zijn geschikt voor survival-analyse?
pandas en numpy zijn respectievelijk geladen als pd en np.
Deze oefening maakt deel uit van de cursus
Survivalanalyse in Python
Praktische interactieve oefening
Zet theorie om in actie met een van onze interactieve oefeningen.
Begin met trainen