Einen Generator schreiben, um Daten in Blöcken zu laden (3)
Großartig! Du hast gerade eine Generatorfunktion erstellt, mit der du große Dateien verarbeiten kannst.
Verwenden wir nun deine Generatorfunktion, um den Datensatz der Weltbank zu verarbeiten, wie du es zuvor getan hast. Du bearbeitest die Datei Zeile für Zeile, um ein Dictionary zu erstellen, in dem die Anzahl der Länder in den Spalten des Datensatzes steht. In dieser Aufgabe verarbeitest du jedoch nicht nur 1000 Datenzeilen, sondern den gesamten Datensatz!
Die Generatorfunktion read_large_file()
und die csv-Datei 'world_dev_ind.csv'
sind vorgeladen und bereit für deinen Einsatz. Los geht‘s
Diese Übung ist Teil des Kurses
Python Toolbox
Anleitung zur Übung
- Binde die Datei
'world_dev_ind.csv'
im Kontextmanager mitopen()
anfile
. - Vervollständige die
for
-Schleife so, dass sie über den Generator aus dem Aufruf vonread_large_file()
läuft, um alle Zeilen der Datei zu verarbeiten.
Interaktive Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Initialize an empty dictionary: counts_dict
counts_dict = {}
# Open a connection to the file
with ____ as ____:
# Iterate over the generator from read_large_file()
for line in ____:
row = line.split(',')
first_col = row[0]
if first_col in counts_dict.keys():
counts_dict[first_col] += 1
else:
counts_dict[first_col] = 1
# Print
print(counts_dict)