CommencerCommencer gratuitement

Importer des données depuis d’autres fichiers plats

Même si les CSV sont le type de fichier plat le plus courant, vous rencontrerez parfois des fichiers utilisant d’autres délimiteurs. read_csv() peut tous les charger grâce au paramètre sep. Par défaut, pandas suppose que le séparateur est une virgule, c’est pourquoi nous n’avons pas besoin de préciser sep pour les CSV.

La version des données fiscales du Vermont proposée ici est un fichier à valeurs séparées par des tabulations (TSV). Vous devrez donc utiliser sep pour indiquer le bon délimiteur lors de la lecture du fichier. Rappelez-vous que les tabulations sont représentées par \t. Une fois le fichier chargé, le reste du code regroupe le champ N1, qui contient des catégories de tranches de revenus, afin de créer un graphique des déclarations d’impôts par catégorie de revenu.

Cet exercice fait partie du cours

Ingestion de données simplifiée avec pandas

Afficher le cours

Instructions

  • Importez pandas avec l’alias pd.
  • Chargez vt_tax_data_2016.tsv en veillant à définir le bon délimiteur avec le paramètre sep.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Import pandas with the alias pd
____

# Load TSV using the sep keyword argument to set delimiter
data = ____(____, ____)

# Plot the total number of tax returns by income group
counts = data.groupby("agi_stub").N1.sum()
counts.plot.bar()
plt.show()
Modifier et exécuter le code