Menulis iterator untuk memuat data per potongan (1)
Cara lain untuk membaca data yang terlalu besar untuk disimpan di memori adalah dengan membacanya per potongan sebagai DataFrame dengan panjang tertentu, misalnya 100. Sebagai contoh, dengan paket pandas (diimpor sebagai pd), Anda dapat menggunakan pd.read_csv(filename, chunksize=100). Ini akan membuat sebuah objek pembaca yang dapat diiterasi, yang berarti Anda dapat menggunakan next() padanya.
Dalam latihan ini, Anda akan membaca sebuah file dalam potongan DataFrame kecil menggunakan read_csv(). Anda akan menggunakan data World Bank Indicators 'ind_pop.csv', yang tersedia di direktori saat ini, untuk melihat indikator populasi perkotaan di berbagai negara dan tahun.
Latihan ini adalah bagian dari kursus
Kotak Perkakas Python
Petunjuk latihan
- Gunakan
pd.read_csv()untuk membaca'ind_pop.csv'dalam potongan berukuran 10. Tetapkan hasilnya kedf_reader. - Cetak dua potongan pertama dari
df_reader.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Import the pandas package
import pandas as pd
# Initialize reader object: df_reader
df_reader = ____(____, ____)
# Print two chunks
print(____)
print(____)