MulaiMulai sekarang secara gratis

Visualisasikan klaster

Sampai titik ini, kita telah memiliki semua yang dibutuhkan untuk memplot observasi bersama elips yang merepresentasikan klaster.

Selain itu, jika kita ingin menetapkan setiap observasi ke salah satu dari dua klaster, kita dapat menggunakan fungsi clusters() dan membandingkan hasilnya dengan label sebenarnya. Sebagai pengingat, ketika kita hanya menggunakan variabel Weight untuk mengklaster data, kita memprediksi dengan benar 4500 perempuan dan 4556 laki-laki. Mari kita lihat apakah kita dapat memisahkan klaster dengan lebih baik ketika variabel tambahan dimasukkan.

Latihan ini adalah bagian dari kursus

Model Campuran di R

Lihat Kursus

Petunjuk latihan

  • Gunakan geom_point() untuk membuat scatterplot bagi Weight dan BMI. Tambahkan ke plot ini dua elips yang disimpan dalam ellipses_comp_number dengan fungsi geom_path().
  • Perhatikan bahwa elips harus diubah menjadi data frame.
  • Warnai klaster 1 dengan merah dan klaster 2 dengan biru.
  • Estimasikan tabel frekuensi untuk label sebenarnya yang disimpan dalam variabel Gender terhadap label prediksi yang dihasilkan oleh clusters.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Plot the ellipses
gender %>% 
  ggplot(aes(x = ___, y = ___)) + ___()+
  geom_path(data = data.frame(ellipse_comp_1), aes(x=x,y=y), col = "___") +
  geom_path(data = data.frame(ellipse_comp_2), aes(x=x,y=y), col = "___")
# Check the assignments
table(gender$Gender, clusters(fit_with_cov))
Edit dan Jalankan Kode