Impor berkas secara bertahap
Saat bekerja dengan berkas berukuran besar, sering kali lebih mudah memuat dan memproses data secara bertahap. Mari praktikkan alur kerja ini pada data pajak Vermont.
Sebanyak 500 baris pertama telah dimuat sebagai vt_data_first500. Anda akan mengambil 500 baris berikutnya. Untuk melakukannya, Anda akan menggunakan beberapa argumen kata kunci: nrows dan skiprows untuk mengambil rekaman yang tepat, header untuk memberi tahu pandas bahwa data tidak memiliki nama kolom, dan names untuk memasok nama kolom yang hilang. Anda juga akan menggunakan fungsi list() untuk mengambil nama kolom dari vt_data_first500 agar dapat digunakan kembali.
pandas telah diimpor sebagai pd.
Latihan ini adalah bagian dari kursus
Pemasukan Data yang Efisien dengan pandas
Petunjuk latihan
- Gunakan
nrowsdanskiprowsuntuk membuat dataframe,vt_data_next500, dengan 500 baris berikutnya. - Atur argumen
headeragarpandasmengetahui tidak ada baris header. - Beri nama kolom di
vt_data_next500dengan memberikan daftar kolom milikvt_data_first500ke argumennames.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Create dataframe of next 500 rows with labeled columns
vt_data_next500 = pd.read_csv("vt_tax_data_2016.csv",
____,
____,
____,
____)
# View the Vermont dataframes to confirm they're different
print(vt_data_first500.head())
print(vt_data_next500.head())