Mengganti rating dengan median per grup
Pada latihan sebelumnya, Anda mengganti nilai yang hilang di kolom rating dengan median kolom tersebut. Namun, bisakah Anda melakukannya lebih baik? Bisa! Anda dapat mengganti nilai yang hilang dengan median rating cokelat dari perusahaan yang sama. Mari kita coba!
Tersedia fungsi replace_missing() yang telah didefinisikan, menerima dua argumen — sebuah DataFrame group dan sebuah kolom col. Fungsi ini mencoba menghitung median dari kolom col dan mengembalikannya jika berhasil. Jika perhitungan median gagal, misalnya karena tidak ada nilai, maka fungsi akan mengembalikan nilai yang sudah ditentukan.
Himpunan data chocolates serta paket DataFrames dan Statistics telah dimuat untuk Anda.
Latihan ini adalah bagian dari kursus
Manipulasi Data di Julia
Petunjuk latihan
- Kelompokkan
chocolatesberdasarkancompanydan iterasikan GroupedDataFrame-nya. - Subset setiap grup menggunakan
ismissing()pada kolomrating, lalu ganti nilai yang hilang dengan nilai dari fungsireplace_missing().
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Group by company and iterate
for group in ____(____)
# Subset each group using ismissing() and the rating column, assign a new value
group[____, ____] .= replace_missing(group, :rating)
end
println(describe(chocolates, :nmissing))