Vaka verilerinde hiyerarşik kümeleme
Bu egzersizin amacı, gözlemler üzerinde hiyerarşik kümeleme yapmak. Bölüm 2'den hatırlayacağın üzere bu tür kümeleme, veride var olan doğal grup sayısını önceden varsaymaz.
Hiyerarşik kümeleme için hazırlığın bir parçası olarak, tüm gözlem çiftleri arasındaki uzaklıklar hesaplanır. Ayrıca kümeleri birbirine bağlamanın farklı yolları vardır; en yaygın bağ yöntemleri single, complete ve average’dır.
Bu egzersiz
R ile Denetimsiz Öğrenme
kursunun bir parçasıdırEgzersiz talimatları
Daha önce oluşturduğun wisc.data, diagnosis, wisc.pr ve pve değişkenleri çalışma alanında mevcut.
wisc.dataverisini ölçeklendir ve sonucudata.scaled'a ata.- Yeni ölçeklendirilmiş veri kümesindeki tüm gözlem çiftleri arasındaki (Öklidyen) uzaklıkları hesapla ve sonucu
data.dist'e ata. - Complete linkage kullanarak bir hiyerarşik kümeleme modeli oluştur.
hclust()içinmethodargümanını elle belirt ve sonucuwisc.hclust'e ata.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Scale the wisc.data data: data.scaled
# Calculate the (Euclidean) distances: data.dist
# Create a hierarchical clustering model: wisc.hclust