Plot Elbow (Scree)
Pada latihan sebelumnya Anda telah menghitung total within-cluster sum of squares untuk nilai k dari 1 hingga 10. Anda dapat memvisualisasikan hubungan ini menggunakan plot garis untuk membuat yang disebut elbow plot (atau scree plot).
Saat menafsirkan elbow plot, Anda ingin melihat penurunan tajam dari satu k ke k berikutnya, kemudian diikuti penurunan kemiringan yang lebih bertahap. Nilai k terakhir sebelum kemiringan plot mulai mendatar menunjukkan nilai k yang "baik".
Latihan ini adalah bagian dari kursus
Analisis Klaster di R
Petunjuk latihan
- Melanjutkan pekerjaan Anda dari latihan sebelumnya, gunakan nilai dalam
elbow_dfuntuk membuat plot garis yang menunjukkan hubungan antara k dan total within-cluster sum of squares.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Use map_dbl to run many models with varying value of k (centers)
tot_withinss <- map_dbl(1:10, function(k){
model <- kmeans(x = lineup, centers = k)
model$tot.withinss
})
# Generate a data frame containing both k and tot_withinss
elbow_df <- data.frame(
k = 1:10,
tot_withinss = tot_withinss
)
# Plot the elbow plot
ggplot(___, aes(x = ___, y = ___)) +
geom_line() +
scale_x_continuous(breaks = 1:10)