1. Učit se
  2. /
  3. Kurzy
  4. /
  5. ETL a ELT v Pythonu

Connected

cvičení

Doplňování chybějících hodnot pomocí pandas

Při budování datových pipeline se nevyhnutelně setkáš s chybějícími daty. V některých případech tato záznamy z datasetu odstraníš, jindy ale budeš muset chybějící hodnoty doplnit. V tomto cvičení si procvičíš, jak k tomu využít pandas.

Data ze souboru "testing_scores.json" jsou načtena do DataFrame a uložena v proměnné raw_testing_scores. Knihovna pandas je dostupná pod aliasem pd.

Pokyny 1/3

undefined XP
    1
    2
    3
  • Vypiš head DataFrame raw_testing_scores a prohlédni si hodnoty NaN.