1. Nauka
  2. /
  3. Kursy
  4. /
  5. Sprawne importowanie danych z pandas

Connected

ćwiczenie

Wczytywanie danych z innych plików płaskich

Pliki CSV są najczęściej spotykanym rodzajem pliku płaskiego, ale czasem trafisz na pliki używające innych separatorów. Funkcja read_csv() potrafi wczytać każdy z nich dzięki argumentowi sep. Domyślnie pandas zakłada, że separatorem jest przecinek – dlatego nie trzeba podawać sep w przypadku plików CSV.

Wersja danych podatkowych stanu Vermont użyta w tym ćwiczeniu to plik z wartościami rozdzielanymi tabulatorami (TSV), więc musisz użyć argumentu sep, aby przekazać właściwy separator podczas wczytywania pliku. Pamiętaj, że tabulator jest reprezentowany jako \t. Po załadowaniu pliku pozostały kod grupuje pole N1, które zawiera kategorie zakresów dochodów, i tworzy wykres zeznań podatkowych według kategorii dochodów.

Instrukcje

100 XP
  • Zaimportuj bibliotekę pandas z aliasem pd.
  • Wczytaj plik vt_tax_data_2016.tsv, pamiętając o ustawieniu właściwego separatora za pomocą argumentu sep.