CommencerCommencer gratuitement

Choisir les bonnes données pour l’analyse de survie

Imaginons que vous travaillez à estimer la vitesse de propagation d’une nouvelle souche de virus dans une population. Il est toujours recommandé d’explorer les données disponibles avant de décider d’utiliser un modèle statistique. Vérifiez les hypothèses du modèle et les exigences vis-à-vis des données.

Trois jeux de données ont été chargés pour vous :

  • virus_record_a
  • virus_record_b
  • virus_record_c

Inspectez chaque DataFrame dans la console. Lequel de ces DataFrames conviendrait à une analyse de survie ?

pandas et numpy sont chargés sous les alias pd et np, respectivement.

Cet exercice fait partie du cours

Analyse de survie en Python

Afficher le cours

Exercice interactif pratique

Passez de la théorie à la pratique avec l’un de nos exercices interactifs

Commencer l’exercice