Eine Datei in Blöcken importieren
Bei großen Dateien ist es oft einfacher, die Daten in Teilen zu laden und zu verarbeiten. Übe diesen Ablauf mit den Vermont-Steuerdaten.
Die ersten 500 Zeilen wurden als vt_data_first500 geladen. Du holst dir jetzt die nächsten 500 Zeilen. Dafür verwendest du mehrere Schlüsselwortargumente: nrows und skiprows, um die richtigen Datensätze zu laden, header, um pandas mitzuteilen, dass die Daten keine Spaltennamen haben, und names, um die fehlenden Spaltennamen anzugeben. Außerdem nutzt du die Funktion list(), um die Spaltennamen aus vt_data_first500 zu übernehmen.
pandas wurde als pd importiert.
Diese Übung ist Teil des Kurses
Vereinfachte Datenaufnahme mit pandas
Anleitung zur Übung
- Verwende
nrowsundskiprows, um einen DataFramevt_data_next500mit den nächsten 500 Zeilen zu erstellen. - Setze das Argument
headerso, dasspandasweiß, dass es keine Kopfzeile gibt. - Benenne die Spalten in
vt_data_next500, indem du eine Liste der Spalten vonvt_data_first500an das Argumentnamesübergibst.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Create dataframe of next 500 rows with labeled columns
vt_data_next500 = pd.read_csv("vt_tax_data_2016.csv",
____,
____,
____,
____)
# View the Vermont dataframes to confirm they're different
print(vt_data_first500.head())
print(vt_data_next500.head())