kmeans() ve hclust() karşılaştırması

k-means ile hiyerarşik kümelemeyi karşılaştırdığında, iki yöntemin farklı küme üyelikleri ürettiğini göreceksin. Bunun nedeni, iki algoritmanın verinin nasıl üretildiğine dair farklı varsayımlar yapmasıdır. Daha ileri bir derste, modellerin varsayımlarının kalitesine göre birini diğerine tercih edebilirdik; ama şimdilik, farklı olduklarını gözlemlemek yeterli.

Bu egzersizde, iki modelin pokemon veri kümesi üzerindeki sonuçlarını karşılaştırarak nasıl farklılaştıklarını göreceksin.

Bu egzersiz, kursun bir parçasıdır

R ile Denetimsiz Öğrenme

Kursa Göz Atın

Egzersiz talimatları

pokemon verisi üzerinde (3 küme için) çalıştırılmış k-means kümelemesinin sonuçları km.pokemon olarak saklandı. Önceki egzersizde oluşturduğun hiyerarşik kümeleme modeli ise hclust.pokemon olarak hâlâ kullanılabilir.

hclust.pokemon üzerinde cutree() kullanarak her gözleme küme üyeliği ata. Üç küme varsay ve sonucu cut.pokemon adlı bir vektöre ata.
table() kullanarak iki kümeleme yönteminin küme üyeliklerini karşılaştır. k-means model nesnelerinin farklı bileşenlerine $ operatörüyle erişebileceğini unutma.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

# Apply cutree() to hclust.pokemon: cut.pokemon


# Compare methods
table(___, ___)

Kodu Düzenle ve Çalıştır