1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Phân cụm bằng R

Connected

Bài tập

Phân cụm phân cấp: Cây nghề nghiệp

Ở bài trước, bạn đã biết dữ liệu oes sẵn sàng cho phân cụm phân cấp mà không cần tiền xử lý. Trong bài này, bạn sẽ thực hiện các bước cần thiết để xây dựng một dendrogram cho các nghề nghiệp dựa trên mức lương trung bình theo năm và đề xuất các cụm với ngưỡng chiều cao 100,000.

Hướng dẫn

100 XP
  • Tính khoảng cách Euclid giữa các nghề nghiệp và lưu vào dist_oes.
  • Chạy phân cụm phân cấp với phương pháp liên kết average và lưu vào hc_oes.
  • Tạo đối tượng dendrogram dend_oes từ kết quả hclust của bạn bằng hàm as.dendrogram().
  • Vẽ dendrogram.
  • Dùng hàm color_branches() để tạo và vẽ một dendrogram mới với các cụm được tô màu theo ngưỡng cắt chiều cao 100,000.