LoslegenKostenlos loslegen

Teilmenge von Spalten importieren

Die Steuerdaten aus Vermont enthalten 147 Spalten zur Beschreibung von Haushaltszusammensetzung, Einkommensquellen und gezahlten Steuern, jeweils nach Postleitzahl und Einkommensgruppe. Für die meisten Analysen werden nicht alle Spalten benötigt. In dieser Übung erstellst du mit dem Argument usecols von read_csv() ein DataFrame mit weniger Variablen.

Konzentrieren wir uns auf die Haushaltszusammensetzung, um zu sehen, ob es Unterschiede nach Region und Einkommensniveau gibt. Dafür benötigen wir Spalten zur Einkommensgruppe, Postleitzahl, dem Status der Steuererklärung (z. B. ledig oder verheiratet) und zu unterhaltsberechtigten Personen. Die Daten verwenden Codes als Variablennamen, daher findest du die konkreten Spalten in der Anleitung.

pandas ist bereits als pd importiert.

Diese Übung ist Teil des Kurses

Vereinfachte Datenaufnahme mit pandas

Kurs anzeigen

Anleitung zur Übung

  • Erstelle eine Liste der zu verwendenden Spalten: zipcode, agi_stub (Einkommensgruppe), mars1 (Anzahl der Single-Haushalte), MARS2 (Anzahl der Haushalte, die gemeinsam als verheiratet veranlagen), und NUMDEP (Anzahl der unterhaltsberechtigten Personen).
  • Erstelle ein DataFrame aus vt_tax_data_2016.csv, das nur die ausgewählten Spalten verwendet.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Create list of columns to use
cols = ____

# Create dataframe from csv using only selected columns
data = ____("vt_tax_data_2016.csv", ____)

# View counts of dependents and tax returns by income level
print(data.groupby("agi_stub").sum())
Code bearbeiten und ausführen