Eine Datei in Blöcken importieren
Bei großen Dateien ist es oft einfacher, die Daten in Teilen zu laden und zu verarbeiten. Übe diesen Ablauf mit den Vermont-Steuerdaten.
Die ersten 500 Zeilen wurden als vt_data_first500 geladen. Du holst dir jetzt die nächsten 500 Zeilen. Dafür verwendest du mehrere Schlüsselwortargumente: nrows und skiprows, um die richtigen Datensätze zu laden, header, um pandas mitzuteilen, dass die Daten keine Spaltennamen haben, und names, um die fehlenden Spaltennamen anzugeben. Außerdem nutzt du die Funktion list(), um die Spaltennamen aus vt_data_first500 zu übernehmen.
pandas wurde als pd importiert.
Diese Übung ist Teil des Kurses
<Kurs>Vereinfachte Datenaufnahme mit pandas</Kurs>Übungsanweisungen
- Verwende
nrowsundskiprows, um einen DataFramevt_data_next500mit den nächsten 500 Zeilen zu erstellen. - Setze das Argument
headerso, dasspandasweiß, dass es keine Kopfzeile gibt. - Benenne die Spalten in
vt_data_next500, indem du eine Liste der Spalten vonvt_data_first500an das Argumentnamesübergibst.
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Create dataframe of next 500 rows with labeled columns
vt_data_next500 = pd.read_csv("vt_tax_data_2016.csv",
____,
____,
____,
____)
# View the Vermont dataframes to confirm they're different
print(vt_data_first500.head())
print(vt_data_next500.head())