1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Học không giám sát với R

Connected

Bài tập

Phân cụm phân cấp cho dữ liệu nghiên cứu tình huống

Mục tiêu của bài tập này là thực hiện phân cụm phân cấp cho các quan sát. Nhớ lại từ Chương 2 rằng kiểu phân cụm này không giả định trước số nhóm tự nhiên tồn tại trong dữ liệu.

Trong phần chuẩn bị cho phân cụm phân cấp, khoảng cách giữa mọi cặp quan sát sẽ được tính toán. Ngoài ra, có nhiều cách để nối các cụm với nhau, trong đó single, complete và average là các phương pháp liên kết phổ biến nhất.

Hướng dẫn

100 XP

Các biến bạn đã tạo trước đó, wisc.data, diagnosis, wisc.pr và pve, đang có sẵn trong không gian làm việc của bạn.

  • Chuẩn hóa dữ liệu wisc.data và gán kết quả vào data.scaled.
  • Tính (Euclidean) khoảng cách giữa mọi cặp quan sát trong bộ dữ liệu đã chuẩn hóa mới và gán kết quả vào data.dist.
  • Tạo mô hình phân cụm phân cấp dùng complete linkage. Tự chỉ định đối số method cho hclust() và gán kết quả vào wisc.hclust.