Eine Datei in Blöcken importieren

Bei großen Dateien ist es oft einfacher, die Daten in Teilen zu laden und zu verarbeiten. Übe diesen Ablauf mit den Vermont-Steuerdaten.

Die ersten 500 Zeilen wurden als vt_data_first500 geladen. Du holst dir jetzt die nächsten 500 Zeilen. Dafür verwendest du mehrere Schlüsselwortargumente: nrows und skiprows, um die richtigen Datensätze zu laden, header, um pandas mitzuteilen, dass die Daten keine Spaltennamen haben, und names, um die fehlenden Spaltennamen anzugeben. Außerdem nutzt du die Funktion list(), um die Spaltennamen aus vt_data_first500 zu übernehmen.

pandas wurde als pd importiert.

Diese Übung ist Teil des Kurses

<Kurs>Vereinfachte Datenaufnahme mit pandas</Kurs>

Kurs ansehen

Übungsanweisungen

Verwende nrows und skiprows, um einen DataFrame vt_data_next500 mit den nächsten 500 Zeilen zu erstellen.
Setze das Argument header so, dass pandas weiß, dass es keine Kopfzeile gibt.
Benenne die Spalten in vt_data_next500, indem du eine Liste der Spalten von vt_data_first500 an das Argument names übergibst.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Create dataframe of next 500 rows with labeled columns
vt_data_next500 = pd.read_csv("vt_tax_data_2016.csv", 
                       		  ____,
                       		  ____,
                       		  ____,
                       		  ____)

# View the Vermont dataframes to confirm they're different
print(vt_data_first500.head())
print(vt_data_next500.head())

Code bearbeiten und ausführen