Schreiben eines Iterators, um Daten in Blöcken zu laden (1)

Eine andere Möglichkeit, Daten zu lesen, die zu groß sind, um in Blöcken im Speicher abgelegt zu werden, besteht darin, die Datei als DataFrames mit einer bestimmten Länge, z. B. 100, zu lesen. Mit dem pandas-Paket (importiert als pd) kannst du zum Beispiel pd.read_csv(filename, chunksize=100) verwenden. Dadurch wird ein iterierbares Reader-Objekt erstellt, das heißt, du kannst next() darauf anwenden.

In dieser Aufgabe wirst du eine Datei in kleinen DataFrame-Blöcken mit read_csv() lesen. Du wirst die Daten der Weltbankindikatoren 'ind_pop.csv' verwenden, die du in deinem aktuellen Verzeichnis findest, um dir den Indikator für die städtische Bevölkerung für zahlreiche Länder und Jahre anzusehen.

Diese Übung ist Teil des Kurses

<Kurs>Python Toolbox</Kurs>

Kurs ansehen

Übungsanweisungen

Benutze pd.read_csv(), um 'ind_pop.csv' in Blöcken der Größe 10 einzulesen. Weise das Ergebnis df_reader zu.
Gib die ersten beiden Blöcke von df_reader aus.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Import the pandas package
import pandas as pd

# Initialize reader object: df_reader
df_reader = ____(____, ____)

# Print two chunks
print(____)
print(____)

Code bearbeiten und ausführen