Visualisasikan klaster
Sampai titik ini, kita telah memiliki semua yang dibutuhkan untuk memplot observasi bersama elips yang merepresentasikan klaster.
Selain itu, jika kita ingin menetapkan setiap observasi ke salah satu dari dua klaster, kita dapat menggunakan fungsi clusters() dan membandingkan hasilnya dengan label sebenarnya. Sebagai pengingat, ketika kita hanya menggunakan variabel Weight untuk mengklaster data, kita memprediksi dengan benar 4500 perempuan dan 4556 laki-laki. Mari kita lihat apakah kita dapat memisahkan klaster dengan lebih baik ketika variabel tambahan dimasukkan.
Latihan ini adalah bagian dari kursus
Model Campuran di R
Petunjuk latihan
- Gunakan
geom_point()untuk membuat scatterplot bagiWeightdanBMI. Tambahkan ke plot ini dua elips yang disimpan dalamellipses_comp_numberdengan fungsigeom_path(). - Perhatikan bahwa elips harus diubah menjadi data frame.
- Warnai klaster 1 dengan merah dan klaster 2 dengan biru.
- Estimasikan tabel frekuensi untuk label sebenarnya yang disimpan dalam variabel
Genderterhadap label prediksi yang dihasilkan olehclusters.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Plot the ellipses
gender %>%
ggplot(aes(x = ___, y = ___)) + ___()+
geom_path(data = data.frame(ellipse_comp_1), aes(x=x,y=y), col = "___") +
geom_path(data = data.frame(ellipse_comp_2), aes(x=x,y=y), col = "___")
# Check the assignments
table(gender$Gender, clusters(fit_with_cov))