Klasterisasi hierarkis: Pohon okupasi
Pada latihan sebelumnya Anda telah mempelajari bahwa data oes siap untuk klasterisasi hierarkis tanpa perlu langkah prapemrosesan. Pada latihan ini Anda akan melakukan langkah-langkah yang diperlukan untuk membangun dendrogram pekerjaan berdasarkan rata-rata gaji tahunan dan mengusulkan klaster menggunakan tinggi 100,000.
Latihan ini adalah bagian dari kursus
Analisis Klaster di R
Petunjuk latihan
- Hitung jarak Euclidean antar pekerjaan dan simpan dalam
dist_oes. - Jalankan klasterisasi hierarkis menggunakan tautan average dan simpan dalam
hc_oes. - Buat objek dendrogram
dend_oesdari hasilhclustAnda menggunakan fungsias.dendrogram(). - Plot dendrogram.
- Dengan fungsi
color_branches()buat dan plot dendrogram baru dengan klaster yang diwarnai berdasarkan tinggi pemotongan 100,000.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Calculate Euclidean distance between the occupations
dist_oes <- dist(___, method = ___)
# Generate an average linkage analysis
hc_oes <- hclust(___, method = ___)
# Create a dendrogram object from the hclust variable
dend_oes <- as.dendrogram(___)
# Plot the dendrogram
plot(___)
# Color branches by cluster formed from the cut at a height of 100000
dend_colored <- color_branches(___, h = ___)
# Plot the colored dendrogram
plot(___)