Datentypen festlegen
Beim Laden einer Flatfile versucht pandas, für jede Spalte den passendsten Datentyp zu ermitteln. Manchmal liegt es daneben – vor allem bei Zahlen, die Gruppen oder Eigenschaften statt Mengen darstellen.
Ein Blick ins Data Dictionary von vt_tax_data_2016.csv zeigt zwei solche Spalten. In agi_stub stehen Zahlen, die Einkommenskategorien entsprechen, und zipcode enthält 5-stellige Werte, die als Strings behandelt werden sollten – als Integer würden führende Nullen verloren gehen, die aber Bedeutung haben. Lass uns die korrekten Datentypen über das Argument dtype festlegen.
pandas wurde bereits als pd importiert.
Diese Übung ist Teil des Kurses
Vereinfachte Datenaufnahme mit pandas
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Load csv with no additional arguments
data = ____("vt_tax_data_2016.csv")
# Print the data types
print(____)