1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Streamlined Data Ingestion with pandas

Connected

cvičení

Načítání dat z jiných flat files

Soubory CSV jsou nejběžnějším typem flat file, ale občas narazíš na soubory s jiným oddělovačem. Funkce read_csv() si poradí se všemi díky argumentu sep. Ve výchozím nastavení pandas předpokládá, že oddělovačem je čárka – proto při práci s CSV soubory sep zadávat nemusíš.

Verze dat o daních z Vermontu, se kterou tu pracujeme, je soubor TSV (hodnoty oddělené tabulátorem). Při načítání souboru proto pomocí sep zadej správný oddělovač. Nezapomeň, že tabulátor se zapisuje jako \t. Po načtení souboru zbytek kódu seskupí pole N1, které obsahuje kategorie příjmových pásem, a vytvoří graf daňových přiznání podle příjmové kategorie.

Pokyny

100 XP
  • Importuj pandas s aliasem pd.
  • Načti soubor vt_tax_data_2016.tsv a nezapomeň nastavit správný oddělovač pomocí argumentu sep.