MulaiMulai sekarang secara gratis

Membandingkan kmeans() dan hclust()

Dengan membandingkan k-means dan hierarchical clustering, Anda akan melihat bahwa kedua metode menghasilkan keanggotaan klaster yang berbeda. Ini karena kedua algoritma membuat asumsi yang berbeda tentang bagaimana data dihasilkan. Dalam kursus yang lebih lanjut, kita dapat memilih menggunakan satu model dibandingkan yang lain berdasarkan kualitas asumsi model, tetapi untuk saat ini, cukup untuk mengamati bahwa keduanya berbeda.

Latihan ini akan meminta Anda membandingkan hasil dari kedua model pada himpunan data pokemon untuk melihat perbedaannya.

Latihan ini adalah bagian dari kursus

Unsupervised Learning di R

Lihat Kursus

Petunjuk latihan

Hasil dari menjalankan k-means clustering pada data pokemon (untuk 3 klaster) disimpan sebagai km.pokemon. Model hierarchical clustering yang Anda buat pada latihan sebelumnya masih tersedia sebagai hclust.pokemon.

  • Gunakan cutree() pada hclust.pokemon untuk menetapkan keanggotaan klaster pada setiap observasi. Asumsikan tiga klaster dan simpan hasilnya ke vektor bernama cut.pokemon.
  • Gunakan table() untuk membandingkan keanggotaan klaster antara kedua metode clustering. Ingat bahwa komponen yang berbeda dari objek model k-means dapat diakses dengan operator $.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Apply cutree() to hclust.pokemon: cut.pokemon


# Compare methods
table(___, ___)
Edit dan Jalankan Kode