Mengganti nilai hilang
Cara lain untuk menangani nilai hilang adalah menggantinya semua dengan nilai yang sama. Untuk variabel numerik, salah satu opsinya adalah mengganti nilai dengan 0 — itulah yang akan Anda lakukan di sini. Namun, saat Anda mengganti nilai hilang, Anda membuat asumsi tentang makna dari nilai yang hilang tersebut. Dalam kasus ini, Anda akan mengasumsikan bahwa angka penjualan yang hilang berarti tidak ada penjualan untuk jenis alpukat tersebut pada minggu itu.
Dalam latihan ini, Anda akan melihat bagaimana mengganti nilai hilang dapat memengaruhi distribusi sebuah variabel menggunakan histogram. Anda dapat memplot histogram untuk beberapa variabel sekaligus seperti berikut:
dogs[["height_cm", "weight_kg"]].hist()
pandas telah diimpor sebagai pd dan matplotlib.pyplot telah diimpor sebagai plt. Kumpulan data avocados_2016 tersedia.
Latihan ini adalah bagian dari kursus
Manipulasi Data dengan pandas
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# List the columns with missing values
cols_with_missing = ["small_sold", "large_sold", "xl_sold"]
# Create histograms showing the distributions cols_with_missing
avocados_2016[____].____
# Show the plot
____