CommencerCommencer gratuitement

Spécifier les types de données

Lors du chargement d’un fichier plat, pandas déduit le meilleur type de données pour chaque colonne. Parfois, ses choix ne sont pas les bons, notamment pour des nombres qui représentent des catégories ou des qualités plutôt que des quantités.

En consultant le dictionnaire de données de vt_tax_data_2016.csv, on repère deux colonnes de ce type. La colonne agi_stub contient des nombres qui correspondent à des catégories de revenu, et zipcode contient des valeurs à 5 chiffres qui devraient être des chaînes de caractères — les traiter comme des entiers fait perdre les zéros initiaux, qui sont significatifs. Spécifions les bons types de données avec l’argument dtype.

pandas a été importé pour vous sous le nom pd.

Cet exercice fait partie du cours

Ingestion de données simplifiée avec pandas

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Load csv with no additional arguments
data = ____("vt_tax_data_2016.csv")

# Print the data types
print(____)
Modifier et exécuter le code