1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Phân cụm bằng R

Connected

Bài tập

K-means trên sân bóng đá

Ở chương trước, bạn đã dùng bộ dữ liệu lineup để tìm hiểu về phân cụm phân cấp (hierarchical). Ở chương này, bạn sẽ dùng lại dữ liệu đó để học về phân cụm k-means. Nhắc lại: data frame lineup chứa vị trí của 12 cầu thủ tại thời điểm bắt đầu một trận bóng đá 6 đấu 6.

Cũng như trước, bạn biết trận này có hai đội trên sân, nên bạn có thể chạy k-means với k = 2 để xác định cầu thủ nào thuộc đội nào.

Lưu ý: trong hàm kmeans(), giá trị k được chỉ định bằng tham số centers.

Hướng dẫn

100 XP
  • Xây dựng mô hình k-means tên model_km2 cho dữ liệu lineup bằng hàm kmeans() với centers = 2.
  • Trích xuất vector gán nhãn cụm từ mô hình model_km2$cluster và lưu vào biến clust_km2.
  • Gắn các nhãn cụm này thành một cột cluster vào data frame lineup và lưu kết quả thành data frame mới lineup_km2.
  • Dùng ggplot để vẽ vị trí của từng cầu thủ trên sân và tô màu theo cụm của họ.