CommencerCommencer gratuitement

Supprimer les données manquantes

Maintenant que vous avez exploré le jeu de données volunteer et que vous en comprenez la structure et le contenu, il est temps de commencer à supprimer les valeurs manquantes.

Dans cet exercice, vous allez supprimer à la fois des colonnes et des lignes pour créer un sous-ensemble du jeu de données volunteer.

Cet exercice fait partie du cours

Prétraitement pour le Machine Learning en Python

Afficher le cours

Instructions

  • Supprimez les colonnes Latitude et Longitude de volunteer, et stockez le résultat dans volunteer_cols.
  • Créez un sous-ensemble volunteer_cols en supprimant les lignes contenant des valeurs manquantes dans category_desc, et stockez-le dans une nouvelle variable appelée volunteer_subset.
  • Consultez l’attribut .shape de volunteer_subset pour vérifier que tout a bien fonctionné.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Drop the Latitude and Longitude columns from volunteer
volunteer_cols = ____

# Drop rows with missing category_desc values from volunteer_cols
volunteer_subset = ____

# Print out the shape of the subset
print(____.____)
Modifier et exécuter le code