CommencerCommencer gratuitement

Remplir les valeurs manquantes avec pandas

Lorsque vous créez des pipelines de données, il est inévitable que vous tombiez sur des données manquantes. Dans certains cas, vous pouvez vouloir supprimer ces enregistrements de l'ensemble de données. Mais dans d'autres cas, vous devrez imputer des valeurs pour les informations manquantes. Dans cet exercice, vous vous entraînerez à utiliser pandas pour imputer des résultats de tests manquants.

Les données du fichier "testing_scores.json" ont été lues dans un DataFrame et sont stockées dans la variable raw_testing_scores. En outre, pandas a été chargé en tant que pd.

Cet exercice fait partie du cours

ETL et ELT en Python

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Print the head of the `raw_testing_scores` DataFrame
print(raw_testing_scores.____)
Modifier et exécuter le code