1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Introduction to Data Engineering

Connected

cvičení

Odfiltrování poškozených dat

Jedním z opakujících se kroků ve fázi transformace je čištění neúplných dat. V tomto cvičení se podíváš na data o kurzech v následujícím formátu:

course_id title description programming_language
1 Some Course … r

Prozkoumáš tento DataFrame a pomocí metod .isnull().sum() z knihovny pandas ověříš, že v něm nechybí žádné hodnoty. Zjistíš, že sloupec programming_language některé chybějící hodnoty obsahuje.

Dokončíš proto funkci transform_fill_programming_language() tak, aby pomocí metody .fillna() chybějící hodnoty doplnila.

Pokyny

100 XP
  • Vypiš počet chybějících hodnot v course_data.
  • Chybějící hodnoty ve sloupci programming_language nahraď jazykem „R".
  • Vypiš počet chybějících hodnot pro každý sloupec ještě jednou, tentokrát pro transformed.