1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Phân cụm bằng R

Connected

Bài tập

K-means: Phân tích Elbow

Trong các bài trước, bạn đã dùng dendrogram để đề xuất một cách phân cụm tạo ra 3 cụm. Trong bài này, bạn sẽ tận dụng biểu đồ elbow của k-means để đề xuất số cụm "tối ưu".

Hướng dẫn

100 XP
  • Dùng map_dbl() để chạy kmeans() với dữ liệu oes cho các giá trị k từ 1 đến 10 và trích xuất giá trị tổng phương sai trong cụm từ mỗi mô hình: model$tot.withinss. Lưu vector kết quả vào tot_withinss.
  • Tạo một data frame mới elbow_df chứa các giá trị k và vector tổng phương sai trong cụm.
  • Dùng các giá trị trong elbow_df để vẽ biểu đồ đường thể hiện mối quan hệ giữa k và tổng phương sai trong cụm.