1. Nauka
  2. /
  3. Kursy
  4. /
  5. Sprawne importowanie danych z pandas

Connected

ćwiczenie

Określanie typów danych

Podczas wczytywania pliku płaskiego pandas automatycznie dobiera najlepszy typ danych dla każdej kolumny. Czasem jednak te odgadnięcia są błędne – zwłaszcza w przypadku liczb reprezentujących kategorie lub cechy jakościowe, a nie wartości ilościowe.

Analiza słownika danych dla pliku vt_tax_data_2016.csv ujawnia dwie takie kolumny. Kolumna agi_stub zawiera liczby odpowiadające kategoriom dochodów, a zipcode przechowuje 5-cyfrowe wartości, które powinny być ciągami znaków – traktowanie ich jako liczb całkowitych powoduje utratę wiodących zer, które są znaczące. Użyj argumentu dtype, aby wskazać właściwe typy danych.

pandas zostało zaimportowane jako pd.

Instrukcje 1/2

undefined XP
    1
    2

Wczytaj plik vt_tax_data_2016.csv bez żadnych argumentów i sprawdź atrybut dtypes ramki danych. Zwróć uwagę na typy danych kolumn zipcode i agi_stub.