Einen Iterator schreiben, um Daten in Blöcken zu laden (1)
Eine andere Möglichkeit, Daten zu lesen, die zu groß sind, um in Blöcken im Speicher abgelegt zu werden, besteht darin, die Datei als DataFrames mit einer bestimmten Länge, z. B. 100, zu lesen. Mit dem pandas-Paket (importiert als pd
) kannst du zum Beispiel pd.read_csv(filename, chunksize=100)
verwenden. Dadurch wird ein iterierbares Reader-Objekt erstellt, das heißt, du kannst next()
darauf anwenden.
In dieser Aufgabe wirst du eine Datei in kleinen DataFrame-Blöcken mit read_csv()
lesen. Du wirst die Daten der Weltbankindikatoren 'ind_pop.csv'
verwenden, die du in deinem aktuellen Verzeichnis findest, um dir den Indikator für die städtische Bevölkerung für zahlreiche Länder und Jahre anzusehen.
Diese Übung ist Teil des Kurses
Python Toolbox
Anleitung zur Übung
- Benutze
pd.read_csv()
, um'ind_pop.csv'
in Blöcken der Größe 10 einzulesen. Weise das Ergebnisdf_reader
zu. - Gib die ersten beiden Blöcke von
df_reader
aus.
Interaktive Übung zum Anfassen
Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.
# Import the pandas package
import pandas as pd
# Initialize reader object: df_reader
df_reader = ____(____, ____)
# Print two chunks
print(____)
print(____)