1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Streamlined Data Ingestion with pandas

Connected

cvičení

Určení datových typů

Při načítání plochého souboru pandas automaticky odhadne nejvhodnější datový typ pro každý sloupec. Někdy ale jeho odhady nejsou přesné – zvláště u čísel, která představují kategorie nebo vlastnosti, nikoli číselné hodnoty.

Pohled do datového slovníku pro vt_tax_data_2016.csv odhalí dva takové sloupce. Sloupec agi_stub obsahuje čísla odpovídající kategoriím příjmů a sloupec zipcode má pětimístné hodnoty, které by měly být řetězce – pokud bychom je zpracovávali jako celá čísla, přišli bychom o úvodní nuly, které nesou důležitou informaci. Pojďme nastavit správné datové typy pomocí argumentu dtype.

pandas je už naimportován jako pd.

Pokyny 1/2

undefined XP
    1
    2

Načti soubor vt_tax_data_2016.csv bez argumentů a prohlédni si atribut dtypes výsledného dataframu. Všimni si datových typů sloupců zipcode a agi_stub.