CommencerCommencer gratuitement

Comprendre vos données de classification

Vous allez maintenant commencer la modélisation avec un nouveau jeu de données pour un problème de classification. Ces données contiennent des informations sur les passagers du Titanic. Vous utiliserez des prédicteurs comme age, fare et le port d’embarquement de chaque passager pour prédire qui a survécu. Ces données proviennent d’un tutoriel sur les compétitions de data science. Vous trouverez ici la description des variables.

Les données sont préchargées dans un DataFrame pandas appelé df.

Il est judicieux d’examiner les valeurs maximales et minimales de chaque variable pour vérifier que les données ne sont ni mal formatées ni corrompues. Quel était l’âge maximal des passagers du Titanic ? Utilisez la méthode .describe() dans l’IPython Shell pour répondre à cette question.

Cet exercice fait partie du cours

Introduction au Deep Learning en Python

Afficher le cours

Exercice interactif pratique

Passez de la théorie à la pratique avec l’un de nos exercices interactifs

Commencer l’exercice