1. Nauka
  2. /
  3. Kursy
  4. /
  5. Sprawne importowanie danych z pandas

Connected

ćwiczenie

Ustawianie niestandardowych wartości NA

Eksploracja i czyszczenie danych obejmują między innymi sprawdzanie brakujących wartości i wartości NA oraz decydowanie, jak sobie z nimi radzić. Jest to łatwiejsze, gdy brakujące wartości traktowane są jako odrębny typ danych – biblioteka pandas udostępnia funkcje, które działają właśnie na takich wartościach NA. Pandas automatycznie rozpoznaje niektóre wartości jako brakujące, ale za pomocą argumentu na_values możesz wskazać dodatkowe wskaźniki NA. W tym ćwiczeniu zrobisz to, aby nieprawidłowe kody pocztowe w danych podatkowych stanu Vermont były kodowane jako NA.

pandas zostało zaimportowane jako pd.

Instrukcje

100 XP
  • Utwórz słownik null_values, który określi, że wartości 0 w kolumnie zipcode mają być traktowane jako NA.
  • Wczytaj plik vt_tax_data_2016.csv, używając argumentu na_values i tego słownika, aby nieprawidłowe kody pocztowe były traktowane jako brakujące.