Importa dati da altri flat file
Anche se i CSV sono il tipo di flat file più comune, a volte troverai file che usano delimitatori diversi. read_csv() può caricarli tutti grazie all'argomento keyword sep. Per impostazione predefinita, pandas presume che il separatore sia una virgola, motivo per cui non dobbiamo specificare sep per i CSV.
La versione dei dati fiscali del Vermont qui è un file con valori separati da tabulazioni (TSV), quindi dovrai usare sep per passare il delimitatore corretto quando leggi il file. Ricorda che le tabulazioni sono rappresentate come \t. Una volta caricato il file, il codice rimanente raggruppa il campo N1, che contiene le categorie di fasce di reddito, per creare un grafico delle dichiarazioni dei redditi per categoria di reddito.
Questo esercizio fa parte del corso
Acquisizione dati semplificata con pandas
Istruzioni dell'esercizio
- Importa
pandascon l'aliaspd. - Carica
vt_tax_data_2016.tsv, assicurandoti di impostare il delimitatore corretto con l'argomento keywordsep.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Import pandas with the alias pd
____
# Load TSV using the sep keyword argument to set delimiter
data = ____(____, ____)
# Plot the total number of tax returns by income group
counts = data.groupby("agi_stub").N1.sum()
counts.plot.bar()
plt.show()