Remplir les valeurs manquantes avec pandas
Lorsque vous créez des pipelines de données, il est inévitable que vous tombiez sur des données manquantes. Dans certains cas, vous pouvez vouloir supprimer ces enregistrements de l'ensemble de données. Mais dans d'autres cas, vous devrez imputer des valeurs pour les informations manquantes. Dans cet exercice, vous vous entraînerez à utiliser pandas
pour imputer des résultats de tests manquants.
Les données du fichier "testing_scores.json"
ont été lues dans un DataFrame et sont stockées dans la variable raw_testing_scores
. En outre, pandas
a été chargé en tant que pd
.
Cet exercice fait partie du cours
ETL et ELT en Python
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Print the head of the `raw_testing_scores` DataFrame
print(raw_testing_scores.____)