Specificare i tipi di dati
Quando carichi un flat file, pandas deduce il tipo di dato migliore per ogni colonna. A volte però sbaglia, soprattutto per numeri che rappresentano gruppi o qualità invece di quantità.
Consultando il data dictionary di vt_tax_data_2016.csv emergono due colonne di questo tipo. La colonna agi_stub contiene numeri che corrispondono a categorie di reddito, e zipcode ha valori di 5 cifre che dovrebbero essere stringhe: trattarli come interi fa perdere gli 0 iniziali, che sono significativi. Specifichiamo i tipi di dati corretti con l’argomento dtype.
pandas è già stato importato come pd.
Questo esercizio fa parte del corso
Acquisizione dati semplificata con pandas
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Load csv with no additional arguments
data = ____("vt_tax_data_2016.csv")
# Print the data types
print(____)