Choisir les bonnes données pour l’analyse de survie
Imaginons que vous travaillez à estimer la vitesse de propagation d’une nouvelle souche de virus dans une population. Il est toujours recommandé d’explorer les données disponibles avant de décider d’utiliser un modèle statistique. Vérifiez les hypothèses du modèle et les exigences vis-à-vis des données.
Trois jeux de données ont été chargés pour vous :
virus_record_avirus_record_bvirus_record_c
Inspectez chaque DataFrame dans la console. Lequel de ces DataFrames conviendrait à une analyse de survie ?
pandas et numpy sont chargés sous les alias pd et np, respectivement.
Cet exercice fait partie du cours
Analyse de survie en Python
Exercice interactif pratique
Passez de la théorie à la pratique avec l’un de nos exercices interactifs
Commencer l’exercice