Comprendre vos données de classification
Vous allez maintenant commencer la modélisation avec un nouveau jeu de données pour un problème de classification. Ces données contiennent des informations sur les passagers du Titanic. Vous utiliserez des prédicteurs comme age, fare et le port d’embarquement de chaque passager pour prédire qui a survécu. Ces données proviennent d’un tutoriel sur les compétitions de data science. Vous trouverez ici la description des variables.
Les données sont préchargées dans un DataFrame pandas appelé df.
Il est judicieux d’examiner les valeurs maximales et minimales de chaque variable pour vérifier que les données ne sont ni mal formatées ni corrompues. Quel était l’âge maximal des passagers du Titanic ? Utilisez la méthode .describe() dans l’IPython Shell pour répondre à cette question.
Cet exercice fait partie du cours
Introduction au Deep Learning en Python
Exercice interactif pratique
Passez de la théorie à la pratique avec l’un de nos exercices interactifs
Commencer l’exercice