1. Apprendre
  2. /
  3. Cours
  4. /
  5. ETL et ELT en Python

Connected

Exercice

Remplir les valeurs manquantes avec pandas

Lors de la création de pipelines de données, vous tomberez inévitablement sur des données manquantes. Dans certains cas, vous pouvez vouloir retirer ces enregistrements de l'ensemble de données. Mais dans d'autres, vous devrez imputer des valeurs pour l'information manquante. Dans cet exercice, vous pratiquerez l'utilisation de pandas pour imputer des résultats de tests manquants.

Les données du fichier "testing_scores.json" ont été lues dans un DataFrame et sont stockées dans la variable raw_testing_scores. De plus, pandas a été importé sous le nom pd.

Instructions 1/3

undefined XP
    1
    2
    3
  • Affichez l'en-tête (head) du DataFrame raw_testing_scores et observez les valeurs NaN.