1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Phân cụm bằng R

Connected

Bài tập

Gán thành viên cụm

Trong bài tập này, bạn sẽ dùng hàm hclust() để tính các bước liên kết lặp và dùng hàm cutree() để trích xuất nhãn cụm cho số lượng cụm (k) mong muốn.

Bạn được cung cấp vị trí của 12 cầu thủ ở thời điểm bắt đầu một trận bóng đá 6v6. Dữ liệu được lưu trong data frame lineup.

Bạn biết trận đấu này có hai đội (k = 2). Hãy dùng các phương pháp phân cụm bạn đã học để gán mỗi cầu thủ vào đội tương ứng dựa trên vị trí của họ.

Lưu ý:

  • Phương pháp liên kết có thể truyền qua tham số method: hclust(distance_matrix, method = "complete")
  • Trong bóng đá, hai đội đứng ở hai nửa sân đối diện khi bắt đầu trận.
  • Vì các vị trí được đo trên cùng một thang đo nên không cần chuẩn hóa lại dữ liệu.

Hướng dẫn

100 XP
  • Tính ma trận khoảng cách Euclid dist_players giữa cả mười hai cầu thủ.
  • Thực hiện tính liên kết complete cho phân cụm phân cấp bằng hclust và lưu vào hc_players.
  • Tạo vector gán cụm clusters_k2 bằng cutree() với k = 2.
  • Thêm cột gán cụm cluster vào data frame lineup và lưu kết quả vào data frame mới tên lineup_k2_complete.