kmeans() ve hclust() karşılaştırması
k-means ile hiyerarşik kümelemeyi karşılaştırdığında, iki yöntemin farklı küme üyelikleri ürettiğini göreceksin. Bunun nedeni, iki algoritmanın verinin nasıl üretildiğine dair farklı varsayımlar yapmasıdır. Daha ileri bir derste, modellerin varsayımlarının kalitesine göre birini diğerine tercih edebilirdik; ama şimdilik, farklı olduklarını gözlemlemek yeterli.
Bu egzersizde, iki modelin pokemon veri kümesi üzerindeki sonuçlarını karşılaştırarak nasıl farklılaştıklarını göreceksin.
Bu egzersiz
R ile Denetimsiz Öğrenme
kursunun bir parçasıdırEgzersiz talimatları
pokemon verisi üzerinde (3 küme için) çalıştırılmış k-means kümelemesinin sonuçları km.pokemon olarak saklandı. Önceki egzersizde oluşturduğun hiyerarşik kümeleme modeli ise hclust.pokemon olarak hâlâ kullanılabilir.
hclust.pokemonüzerindecutree()kullanarak her gözleme küme üyeliği ata. Üç küme varsay ve sonucucut.pokemonadlı bir vektöre ata.table()kullanarak iki kümeleme yönteminin küme üyeliklerini karşılaştır. k-means model nesnelerinin farklı bileşenlerine$operatörüyle erişebileceğini unutma.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Apply cutree() to hclust.pokemon: cut.pokemon
# Compare methods
table(___, ___)