1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Phân cụm bằng R

Connected

Bài tập

K-means: Độ rộng silhouette trung bình

Vậy phân cụm phân cấp cho ra 3 cụm, còn phương pháp khuỷu tay gợi ý 2. Trong bài tập này, hãy dùng độ rộng silhouette trung bình để khám phá xem giá trị k “tối ưu” nên là bao nhiêu.

Hướng dẫn

100 XP
  • Dùng map_dbl() để chạy pam() với dữ liệu oes cho các giá trị k từ 2 đến 10 và trích xuất giá trị độ rộng silhouette trung bình từ mỗi mô hình: model$silinfo$avg.width. Lưu vector kết quả vào sil_width.
  • Tạo một data frame mới sil_df chứa các giá trị k và vector độ rộng silhouette trung bình.
  • Dùng các giá trị trong sil_df để vẽ biểu đồ đường thể hiện mối quan hệ giữa k và độ rộng silhouette trung bình.