Scrivere un iteratore per caricare i dati in blocchi (1)
Un altro modo per leggere dati troppo grandi per essere memorizzati in blocchi è leggere il file come DataFrame di una certa lunghezza, ad esempio 100. Per esempio, con il pacchetto pandas (importato come pd), puoi fare pd.read_csv(filename, chunksize=100). Questo crea un oggetto lettore iterabile, il che vuol dire che puoi usare next() su di esso.
In questo esercizio, leggerai un file in piccoli blocchi DataFrame con read_csv(). Userai i dati degli indicatori della Banca Mondiale 'ind_pop.csv', che trovi nella tua cartella corrente, per dare un'occhiata all'indicatore della popolazione urbana di diversi paesi e anni.
Questo esercizio fa parte del corso
Strumenti per Python
Istruzioni dell'esercizio
- Usa
pd.read_csv()per leggere'ind_pop.csv'in blocchi di 10. Assegna il risultato adf_reader. - Stampa i primi due blocchi da
df_reader.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Import the pandas package
import pandas as pd
# Initialize reader object: df_reader
df_reader = ____(____, ____)
# Print two chunks
print(____)
print(____)