Cluster berdasarkan tinggi
Pada latihan sebelumnya, Anda telah mengelompokkan observasi ke dalam cluster menggunakan jumlah cluster (k) yang telah ditentukan. Pada latihan ini, Anda akan memanfaatkan representasi visual dendrogram untuk mengelompokkan observasi berdasarkan tinggi maksimum (h), di bawah tinggi tersebut cluster terbentuk.
Anda akan menggunakan fungsi color_branches() dari pustaka dendextend untuk meninjau secara visual cluster yang terbentuk pada ketinggian mana pun di sepanjang dendrogram.
Objek hc_players telah dibawa dari pekerjaan Anda sebelumnya dengan data susunan pemain sepak bola.
Latihan ini adalah bagian dari kursus
Analisis Klaster di R
Petunjuk latihan
- Buat objek dendrogram
dend_playersdari hasilhclustAnda menggunakan fungsias.dendrogram(). - Plot dendrogram tersebut.
- Gunakan fungsi
color_branches()untuk membuat dan memplot dendrogram baru dengan cluster yang diwarnai berdasarkan tinggi potong 20. - Ulangi langkah di atas dengan tinggi 40.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
library(dendextend)
dist_players <- dist(lineup, method = 'euclidean')
hc_players <- hclust(dist_players, method = "complete")
# Create a dendrogram object from the hclust variable
dend_players <- as.dendrogram(___)
# Plot the dendrogram
# Color branches by cluster formed from the cut at a height of 20 & plot
dend_20 <- color_branches(___, h = ___)
# Plot the dendrogram with clusters colored below height 20
# Color branches by cluster formed from the cut at a height of 40 & plot
dend_40 <- ___
# Plot the dendrogram with clusters colored below height 40