1. Nauka
  2. /
  3. Kursy
  4. /
  5. Sprawne importowanie danych z pandas

Connected

ćwiczenie

Ustawianie kolumn logicznych

Zbiory danych mogą zawierać kolumny, które najlepiej reprezentować jako wartości logiczne. Domyślnie pandas wczytuje je jednak jako liczby zmiennoprzecinkowe – automatyczne stosowanie typu Boolean mogłoby powodować niepożądane efekty, np. przekształcanie wartości NA w True.

Plik fcc_survey_subset.xlsx zawiera kolumnę z identyfikatorami tekstowymi oraz kilka kolumn Prawda/Fałsz opisujących czynniki stresu finansowego. Sprawdzisz, które kolumny (poza kolumną ID) nie zawierają wartości NA i można je ustawić jako logiczne, a następnie przekażesz to informację funkcji read_excel() za pomocą argumentu dtype.

Biblioteka pandas jest załadowana jako pd.

Instrukcje 1/2

undefined XP
    1
    2
  • Zlicz wartości NA w każdej kolumnie ramki danych survey_data, używając metod isna() i sum(). Zwróć uwagę, które kolumny poza ID.x (jeśli takie są) mają zero wartości NA.