Scrivere un iteratore per caricare i dati in blocchi (1)

Un altro modo per leggere dati troppo grandi per essere memorizzati in blocchi è leggere il file come DataFrame di una certa lunghezza, ad esempio 100. Per esempio, con il pacchetto pandas (importato come pd), puoi fare pd.read_csv(filename, chunksize=100). Questo crea un oggetto lettore iterabile, il che vuol dire che puoi usare next() su di esso.

In questo esercizio, leggerai un file in piccoli blocchi DataFrame con read_csv(). Userai i dati degli indicatori della Banca Mondiale 'ind_pop.csv', che trovi nella tua cartella corrente, per dare un'occhiata all'indicatore della popolazione urbana di diversi paesi e anni.

Questo esercizio fa parte del corso

Strumenti per Python

Visualizza corso

Istruzioni dell'esercizio

Usa pd.read_csv() per leggere 'ind_pop.csv' in blocchi di 10. Assegna il risultato a df_reader.
Stampa i primi due blocchi da df_reader.

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

# Import the pandas package
import pandas as pd

# Initialize reader object: df_reader
df_reader = ____(____, ____)

# Print two chunks
print(____)
print(____)

Modifica ed esegui il codice