MulaiMulai sekarang secara gratis

Atur nilai NA kustom

Sebagian dari eksplorasi dan pembersihan data mencakup pemeriksaan nilai hilang atau NA dan memutuskan cara menanganinya. Ini lebih mudah ketika nilai hilang diperlakukan sebagai tipe data tersendiri, dan ada fungsi pandas yang secara khusus menargetkan nilai NA tersebut. pandas secara otomatis memperlakukan beberapa nilai sebagai hilang, tetapi kita dapat memberikan penanda NA tambahan melalui argumen na_values. Di sini, Anda akan melakukannya untuk memastikan kode ZIP tidak valid dalam data pajak Vermont dikodekan sebagai NA.

pandas telah diimpor sebagai pd.

Latihan ini adalah bagian dari kursus

Pemasukan Data yang Efisien dengan pandas

Lihat Kursus

Petunjuk latihan

  • Buat sebuah dictionary, null_values, yang menyatakan bahwa 0 pada kolom zipcode harus dianggap sebagai nilai NA.
  • Muat vt_tax_data_2016.csv, gunakan argumen na_values dan dictionary tersebut untuk memastikan kode ZIP tidak valid diperlakukan sebagai hilang.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Create dict specifying that 0s in zipcode are NA values
null_values = {____}

# Load csv using na_values keyword argument
data = pd.read_csv("vt_tax_data_2016.csv", 
                   ____)

# View rows with NA ZIP codes
print(data[data.zipcode.isna()])
Edit dan Jalankan Kode