Impor berkas secara bertahap

Saat bekerja dengan berkas berukuran besar, sering kali lebih mudah memuat dan memproses data secara bertahap. Mari praktikkan alur kerja ini pada data pajak Vermont.

Sebanyak 500 baris pertama telah dimuat sebagai vt_data_first500. Anda akan mengambil 500 baris berikutnya. Untuk melakukannya, Anda akan menggunakan beberapa argumen kata kunci: nrows dan skiprows untuk mengambil rekaman yang tepat, header untuk memberi tahu pandas bahwa data tidak memiliki nama kolom, dan names untuk memasok nama kolom yang hilang. Anda juga akan menggunakan fungsi list() untuk mengambil nama kolom dari vt_data_first500 agar dapat digunakan kembali.

pandas telah diimpor sebagai pd.

Latihan ini merupakan bagian dari kursus

Pemasukan Data yang Efisien dengan pandas

Lihat Kursus

Instruksi latihan

Gunakan nrows dan skiprows untuk membuat dataframe, vt_data_next500, dengan 500 baris berikutnya.
Atur argumen header agar pandas mengetahui tidak ada baris header.
Beri nama kolom di vt_data_next500 dengan memberikan daftar kolom milik vt_data_first500 ke argumen names.

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

# Create dataframe of next 500 rows with labeled columns
vt_data_next500 = pd.read_csv("vt_tax_data_2016.csv", 
                       		  ____,
                       		  ____,
                       		  ____,
                       		  ____)

# View the Vermont dataframes to confirm they're different
print(vt_data_first500.head())
print(vt_data_next500.head())

Edit dan Jalankan Kode