1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Phân cụm bằng R

Connected

Bài tập

Khám phá các nhánh bị cắt khỏi cây

Hàm cutree() bạn đã dùng ở bài 5 & 6 cũng có thể cắt cây tại một chiều cao cho trước với tham số h. Hãy dành chút thời gian khám phá các cụm bạn đã tạo ở các bài trước dựa trên các chiều cao 20 & 40.

Hướng dẫn

100 XP
  • Tạo vector gán cụm clusters_h20 bằng cutree() với h = 20.
  • Gắn kết quả gán cụm thành một cột cluster vào data frame lineup và lưu thành data frame mới tên lineup_h20_complete.
  • Lặp lại hai bước trên với chiều cao 40, tạo các biến clusters_h40 và lineup_h40_complete.
  • Dùng ggplot2 để vẽ biểu đồ phân tán, tô màu theo cụm cho cả hai mức chiều cao.