BaşlayınÜcretsiz Başlayın

Vaka verilerinde hiyerarşik kümeleme

Bu egzersizin amacı, gözlemler üzerinde hiyerarşik kümeleme yapmak. Bölüm 2'den hatırlayacağın üzere bu tür kümeleme, veride var olan doğal grup sayısını önceden varsaymaz.

Hiyerarşik kümeleme için hazırlığın bir parçası olarak, tüm gözlem çiftleri arasındaki uzaklıklar hesaplanır. Ayrıca kümeleri birbirine bağlamanın farklı yolları vardır; en yaygın bağ yöntemleri single, complete ve average’dır.

Bu egzersiz

R ile Denetimsiz Öğrenme

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

Daha önce oluşturduğun wisc.data, diagnosis, wisc.pr ve pve değişkenleri çalışma alanında mevcut.

  • wisc.data verisini ölçeklendir ve sonucu data.scaled'a ata.
  • Yeni ölçeklendirilmiş veri kümesindeki tüm gözlem çiftleri arasındaki (Öklidyen) uzaklıkları hesapla ve sonucu data.dist'e ata.
  • Complete linkage kullanarak bir hiyerarşik kümeleme modeli oluştur. hclust() için method argümanını elle belirt ve sonucu wisc.hclust'e ata.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Scale the wisc.data data: data.scaled


# Calculate the (Euclidean) distances: data.dist


# Create a hierarchical clustering model: wisc.hclust
Kodu Düzenle ve Çalıştır