1. Nauka
  2. /
  3. Kursy
  4. /
  5. Sprawne importowanie danych z pandas

Connected

ćwiczenie

Importowanie wybranych kolumn

Dane podatkowe stanu Vermont zawierają 147 kolumn opisujących skład gospodarstw domowych, źródła dochodów oraz zapłacone podatki – z podziałem na kody pocztowe i grupy dochodowe. Większość analiz nie wymaga wszystkich tych kolumn. W tym ćwiczeniu utworzysz ramkę danych z mniejszą liczbą zmiennych, korzystając z argumentu usecols funkcji read_csv().

Skupmy się na składzie gospodarstw domowych, żeby sprawdzić, czy istnieją różnice ze względu na lokalizację i poziom dochodów. Będziemy potrzebować kolumn dotyczących grupy dochodowej, kodu pocztowego, statusu rozliczenia podatkowego (np. osoba samotna lub małżeństwo) oraz liczby osób na utrzymaniu. Dane używają kodów jako nazw zmiennych – konkretne potrzebne kolumny znajdziesz w instrukcjach.

pandas zostało już zaimportowane jako pd.

Instrukcje

100 XP
  • Utwórz listę kolumn do użycia: zipcode, agi_stub (grupa dochodowa), mars1 (liczba jednoosobowych gospodarstw domowych), MARS2 (liczba gospodarstw rozliczających się jako małżeństwo) oraz NUMDEP (liczba osób na utrzymaniu).
  • Utwórz ramkę danych z pliku vt_tax_data_2016.csv, używając tylko wybranych kolumn.