1. Belajar
  2. /
  3. Kursus
  4. /
  5. Manipulasi Data dengan pandas

Connected

Latihan

Mengganti nilai hilang

Cara lain untuk menangani nilai hilang adalah menggantinya semua dengan nilai yang sama. Untuk variabel numerik, salah satu opsinya adalah mengganti nilai dengan 0 — itulah yang akan Anda lakukan di sini. Namun, saat Anda mengganti nilai hilang, Anda membuat asumsi tentang makna dari nilai yang hilang tersebut. Dalam kasus ini, Anda akan mengasumsikan bahwa angka penjualan yang hilang berarti tidak ada penjualan untuk jenis alpukat tersebut pada minggu itu.

Dalam latihan ini, Anda akan melihat bagaimana mengganti nilai hilang dapat memengaruhi distribusi sebuah variabel menggunakan histogram. Anda dapat memplot histogram untuk beberapa variabel sekaligus seperti berikut:

dogs[["height_cm", "weight_kg"]].hist()

pandas telah diimpor sebagai pd dan matplotlib.pyplot telah diimpor sebagai plt. Kumpulan data avocados_2016 tersedia.

Instruksi 1/2

undefined XP
    1
    2
  • Sebuah daftar telah dibuat, cols_with_missing, yang berisi nama kolom dengan nilai hilang: "small_sold", "large_sold", dan "xl_sold".
  • Buat histogram untuk kolom-kolom tersebut.
  • Tampilkan plotnya.