1. Learn
  2. /
  3. Cursuri
  4. /
  5. Wprowadzenie do inżynierii danych

Connected

exercițiu

Odfiltruj uszkodzone dane

Jednym z często powtarzających się kroków w fazie transformacji jest czyszczenie niekompletnych danych. W tym ćwiczeniu przyjrzysz się danym o kursach, które mają następujący format:

course_id title description programming_language
1 Some Course … r

Zbadasz ten DataFrame i upewnisz się, że nie zawiera brakujących wartości – użyjesz do tego metod .isnull().sum() dostępnych w DataFrame z biblioteki pandas. Okaże się, że kolumna programming_language zawiera pewne braki.

Dlatego uzupełnisz funkcję transform_fill_programming_language(), używając metody .fillna() do wypełnienia brakujących wartości.

Instrucțiuni

100 XP
  • Wyświetl liczbę brakujących wartości w course_data.
  • Brakujące wartości w kolumnie programming_language powinny zostać uzupełnione językiem „R".
  • Wyświetl ponownie liczbę brakujących wartości dla każdej kolumny, tym razem dla obiektu transformed.