IniziaInizia gratis

Importa dati da altri flat file

Anche se i CSV sono il tipo di flat file più comune, a volte troverai file che usano delimitatori diversi. read_csv() può caricarli tutti grazie all'argomento keyword sep. Per impostazione predefinita, pandas presume che il separatore sia una virgola, motivo per cui non dobbiamo specificare sep per i CSV.

La versione dei dati fiscali del Vermont qui è un file con valori separati da tabulazioni (TSV), quindi dovrai usare sep per passare il delimitatore corretto quando leggi il file. Ricorda che le tabulazioni sono rappresentate come \t. Una volta caricato il file, il codice rimanente raggruppa il campo N1, che contiene le categorie di fasce di reddito, per creare un grafico delle dichiarazioni dei redditi per categoria di reddito.

Questo esercizio fa parte del corso

Acquisizione dati semplificata con pandas

Visualizza il corso

Istruzioni dell'esercizio

  • Importa pandas con l'alias pd.
  • Carica vt_tax_data_2016.tsv, assicurandoti di impostare il delimitatore corretto con l'argomento keyword sep.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Import pandas with the alias pd
____

# Load TSV using the sep keyword argument to set delimiter
data = ____(____, ____)

# Plot the total number of tax returns by income group
counts = data.groupby("agi_stub").N1.sum()
counts.plot.bar()
plt.show()
Modifica ed esegui il codice