1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Phân cụm trong Python

Connected

Bài tập

Kiểm tra cơ bản trên các cụm

Trong bộ dữ liệu FIFA 18, ở các bài trước chúng ta đã tập trung vào hậu vệ. Giờ hãy chuyển sang các thuộc tính tấn công của cầu thủ. Tốc độ (pac), Rê bóng (dri) và Dứt điểm (sho) là những đặc trưng thường thấy ở các cầu thủ thiên về tấn công. Trong bài này, k-means clustering đã được áp dụng lên dữ liệu sử dụng các giá trị đã được scale của ba thuộc tính này. Hãy thực hiện một vài kiểm tra cơ bản trên các cụm vừa tạo.

Dữ liệu được lưu trong pandas DataFrame, fifa. Tên các cột đã được scale nằm trong danh sách scaled_features. Nhãn cụm được lưu trong cột cluster_labels. Hãy nhớ rằng các phương thức .count() và .mean() trong pandas giúp bạn tìm số lượng quan sát và giá trị trung bình của các quan sát trong một DataFrame.

Hướng dẫn

100 XP
  • In kích thước của các cụm bằng cách nhóm theo cột cluster_labels.
  • In giá trị trung bình của lương cầu thủ trong mỗi cụm. eur_wage là tên cột lưu lương của cầu thủ theo Euro.