Supprimer les données manquantes
Maintenant que vous avez exploré le jeu de données volunteer et que vous en comprenez la structure et le contenu, il est temps de commencer à supprimer les valeurs manquantes.
Dans cet exercice, vous allez supprimer à la fois des colonnes et des lignes pour créer un sous-ensemble du jeu de données volunteer.
Cet exercice fait partie du cours
Prétraitement pour le Machine Learning en Python
Instructions
- Supprimez les colonnes
LatitudeetLongitudedevolunteer, et stockez le résultat dansvolunteer_cols. - Créez un sous-ensemble
volunteer_colsen supprimant les lignes contenant des valeurs manquantes danscategory_desc, et stockez-le dans une nouvelle variable appeléevolunteer_subset. - Consultez l’attribut
.shapedevolunteer_subsetpour vérifier que tout a bien fonctionné.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Drop the Latitude and Longitude columns from volunteer
volunteer_cols = ____
# Drop rows with missing category_desc values from volunteer_cols
volunteer_subset = ____
# Print out the shape of the subset
print(____.____)