1. Learn
  2. /
  3. Courses
  4. /
  5. Phân cụm trong Python

Connected

Exercise

FIFA 18: khám phá hậu vệ

Trong bộ dữ liệu FIFA 18, có nhiều thuộc tính của cầu thủ. Hai thuộc tính như vậy là:

  • sliding tackle: một số từ 0-99 thể hiện độ chính xác khi cầu thủ thực hiện động tác xoạc bóng
  • aggression: một số từ 0-99 thể hiện mức độ quyết liệt và ý chí của cầu thủ

Các chỉ số này thường cao ở những cầu thủ thiên về phòng ngự. Trong bài tập này, bạn sẽ phân cụm dựa trên các thuộc tính này trong dữ liệu.

Dữ liệu gồm 5000 hàng và lớn hơn đáng kể so với các bộ trước. Chạy phân cụm phân cấp trên dữ liệu này có thể mất tới 10 giây.

Các mô-đun sau đã được nạp sẵn: dendrogram, linkage, fcluster từ scipy.cluster.hierarchy, matplotlib.pyplot là plt, seaborn là sns. Dữ liệu được lưu trong một pandas DataFrame tên là fifa.

Instructions 1/4

undefined XP
    1
    2
    3
    4
  • Huấn luyện dữ liệu đã chuẩn hóa trong các cột scaled_sliding_tackle và scaled_aggression bằng thuật toán phân cụm phân cấp. Ngoài ra, bạn có thể kiểm tra thời gian chạy bằng mô-đun timeit.