Aan de slagGa gratis aan de slag

Gegevenstypen opgeven

Bij het inladen van een flat file leidt pandas voor elke kolom het beste gegevenstype af. Soms zit die inschatting ernaast, vooral bij cijfers die groepen of eigenschappen aangeven in plaats van hoeveelheden.

De datadictionary voor vt_tax_data_2016.csv laat twee van dit soort kolommen zien. De kolom agi_stub bevat nummers die horen bij inkomenscategorieën, en zipcode heeft 5-cijferige waarden die strings moeten zijn — als je ze als integers behandelt, raak je voorloopnullen kwijt, en die zijn juist betekenisvol. Laten we de juiste gegevenstypen opgeven met het argument dtype.

pandas is al voor je geïmporteerd als pd.

Deze oefening maakt deel uit van de cursus

Gestroomlijnde data-inname met pandas

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Load csv with no additional arguments
data = ____("vt_tax_data_2016.csv")

# Print the data types
print(____)
Code bewerken en uitvoeren