kmeans() ve hclust() karşılaştırması
k-means ile hiyerarşik kümelemeyi karşılaştırdığında, iki yöntemin farklı küme üyelikleri ürettiğini göreceksin. Bunun nedeni, iki algoritmanın verinin nasıl üretildiğine dair farklı varsayımlar yapmasıdır. Daha ileri bir derste, modellerin varsayımlarının kalitesine göre birini diğerine tercih edebilirdik; ama şimdilik, farklı olduklarını gözlemlemek yeterli.
Bu egzersizde, iki modelin pokemon veri kümesi üzerindeki sonuçlarını karşılaştırarak nasıl farklılaştıklarını göreceksin.
Bu egzersiz, kursun bir parçasıdır
R ile Denetimsiz Öğrenme
Egzersiz talimatları
pokemon verisi üzerinde (3 küme için) çalıştırılmış k-means kümelemesinin sonuçları km.pokemon olarak saklandı. Önceki egzersizde oluşturduğun hiyerarşik kümeleme modeli ise hclust.pokemon olarak hâlâ kullanılabilir.
hclust.pokemonüzerindecutree()kullanarak her gözleme küme üyeliği ata. Üç küme varsay ve sonucucut.pokemonadlı bir vektöre ata.table()kullanarak iki kümeleme yönteminin küme üyeliklerini karşılaştır. k-means model nesnelerinin farklı bileşenlerine$operatörüyle erişebileceğini unutma.
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Apply cutree() to hclust.pokemon: cut.pokemon
# Compare methods
table(___, ___)