Mengambil data dari flat file lainnya
Meskipun CSV adalah jenis flat file yang paling umum, terkadang Anda akan menemukan berkas yang menggunakan pembatas berbeda. read_csv() dapat memuat semuanya dengan bantuan argumen kata kunci sep. Secara bawaan, pandas mengasumsikan bahwa pemisahnya adalah koma, itulah sebabnya kita tidak perlu menentukan sep untuk CSV.
Versi data pajak Vermont di sini adalah berkas tab-separated values (TSV), jadi Anda perlu menggunakan sep untuk memberikan pembatas yang benar saat membaca berkas. Ingat bahwa tab direpresentasikan sebagai \t. Setelah berkas dimuat, kode selanjutnya mengelompokkan kolom N1, yang berisi kategori rentang pendapatan, untuk membuat bagan pengembalian pajak berdasarkan kategori pendapatan.
Latihan ini adalah bagian dari kursus
Pemasukan Data yang Efisien dengan pandas
Petunjuk latihan
- Impor
pandasdengan aliaspd. - Muat
vt_tax_data_2016.tsv, pastikan Anda menetapkan pembatas yang benar dengan argumen kata kuncisep.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Import pandas with the alias pd
____
# Load TSV using the sep keyword argument to set delimiter
data = ____(____, ____)
# Plot the total number of tax returns by income group
counts = data.groupby("agi_stub").N1.sum()
counts.plot.bar()
plt.show()