1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Phân cụm bằng R

Connected

Bài tập

Phân cụm dựa trên chiều cao

Trong các bài trước, bạn đã gom các quan sát vào cụm bằng cách chỉ định trước số cụm (k). Ở bài này, bạn sẽ tận dụng biểu diễn trực quan của dendrogram để gom các quan sát vào cụm dựa trên một chiều cao tối đa (h), dưới ngưỡng đó các cụm sẽ hình thành.

Bạn sẽ dùng hàm color_branches() từ thư viện dendextend để quan sát trực quan các cụm được tạo ra tại bất kỳ mức chiều cao nào trên dendrogram.

Đối tượng hc_players đã được giữ lại từ phần bạn làm trước với dữ liệu đội hình bóng đá.

Hướng dẫn

100 XP
  • Tạo đối tượng dendrogram dend_players từ kết quả hclust của bạn bằng hàm as.dendrogram().
  • Vẽ dendrogram.
  • Dùng hàm color_branches() để tạo và vẽ một dendrogram mới với các cụm được tô màu theo ngưỡng cắt là 20.
  • Lặp lại bước trên với ngưỡng chiều cao là 40.