MulaiMulai sekarang secara gratis

Mengganti rating dengan median per grup

Pada latihan sebelumnya, Anda mengganti nilai yang hilang di kolom rating dengan median kolom tersebut. Namun, bisakah Anda melakukannya lebih baik? Bisa! Anda dapat mengganti nilai yang hilang dengan median rating cokelat dari perusahaan yang sama. Mari kita coba!

Tersedia fungsi replace_missing() yang telah didefinisikan, menerima dua argumen — sebuah DataFrame group dan sebuah kolom col. Fungsi ini mencoba menghitung median dari kolom col dan mengembalikannya jika berhasil. Jika perhitungan median gagal, misalnya karena tidak ada nilai, maka fungsi akan mengembalikan nilai yang sudah ditentukan.

Himpunan data chocolates serta paket DataFrames dan Statistics telah dimuat untuk Anda.

Latihan ini adalah bagian dari kursus

Manipulasi Data di Julia

Lihat Kursus

Petunjuk latihan

  • Kelompokkan chocolates berdasarkan company dan iterasikan GroupedDataFrame-nya.
  • Subset setiap grup menggunakan ismissing() pada kolom rating, lalu ganti nilai yang hilang dengan nilai dari fungsi replace_missing().

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Group by company and iterate
for group in ____(____)

	# Subset each group using ismissing() and the rating column, assign a new value 
	group[____, ____] .= replace_missing(group, :rating)
end

println(describe(chocolates, :nmissing))
Edit dan Jalankan Kode