Scrivere un generatore per caricare i dati in blocchi (3)
Fantastico! Hai appena creato una funzione generatrice che puoi usare per elaborare file di grandi dimensioni.
Ora usiamo la tua funzione generatrice per elaborare il set di dati della Banca Mondiale come hai fatto prima. Elaborerai il file riga per riga, per creare un dizionario che conti quante volte ogni paese compare in una colonna del set di dati. Per questo esercizio, però, non lavorerai solo su 1000 righe di dati, ma sull'intero set di dati!
La funzione generatrice read_large_file() e il file csv 'world_dev_ind.csv' sono già pronti e li puoi usare subito. Dai, buttati!
Questo esercizio fa parte del corso
Strumenti per Python
Istruzioni dell'esercizio
- Collega il file
'world_dev_ind.csv'afilenel gestore di contesto conopen(). - Completa il ciclo "
for" in modo che passi in rassegna il generatore dalla chiamata a "read_large_file()" per elaborare tutte le righe del file.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Initialize an empty dictionary: counts_dict
counts_dict = {}
# Open a connection to the file
with ____ as ____:
# Iterate over the generator from read_large_file()
for line in ____:
row = line.split(',')
first_col = row[0]
if first_col in counts_dict.keys():
counts_dict[first_col] += 1
else:
counts_dict[first_col] = 1
# Print
print(counts_dict)