Atur nilai NA kustom
Sebagian dari eksplorasi dan pembersihan data mencakup pemeriksaan nilai hilang atau NA dan memutuskan cara menanganinya. Ini lebih mudah ketika nilai hilang diperlakukan sebagai tipe data tersendiri, dan ada fungsi pandas yang secara khusus menargetkan nilai NA tersebut. pandas secara otomatis memperlakukan beberapa nilai sebagai hilang, tetapi kita dapat memberikan penanda NA tambahan melalui argumen na_values. Di sini, Anda akan melakukannya untuk memastikan kode ZIP tidak valid dalam data pajak Vermont dikodekan sebagai NA.
pandas telah diimpor sebagai pd.
Latihan ini adalah bagian dari kursus
Pemasukan Data yang Efisien dengan pandas
Petunjuk latihan
- Buat sebuah dictionary,
null_values, yang menyatakan bahwa0pada kolomzipcodeharus dianggap sebagai nilai NA. - Muat
vt_tax_data_2016.csv, gunakan argumenna_valuesdan dictionary tersebut untuk memastikan kode ZIP tidak valid diperlakukan sebagai hilang.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Create dict specifying that 0s in zipcode are NA values
null_values = {____}
# Load csv using na_values keyword argument
data = pd.read_csv("vt_tax_data_2016.csv",
____)
# View rows with NA ZIP codes
print(data[data.zipcode.isna()])