Choisir les bonnes données pour l’analyse de survie
Imaginons que vous travaillez à estimer la vitesse de propagation d’une nouvelle souche de virus dans une population. Il est toujours recommandé d’explorer les données disponibles avant de décider d’utiliser un modèle statistique. Vérifiez les hypothèses du modèle et les exigences vis-à-vis des données.
Trois jeux de données ont été chargés pour vous :
virus_record_avirus_record_bvirus_record_c
Inspectez chaque DataFrame dans la console. Lequel de ces DataFrames conviendrait à une analyse de survie ?
pandas et numpy sont chargés sous les alias pd et np, respectivement.
Cet exercice fait partie du cours
<cours>Analyse de survie en Python</cours>Exercice interactif pratique
Transformez la théorie en action avec l’un de nos exercices interactifs
Commencer l’exercice