1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Phân cụm trong Python

Connected

Bài tập

Mẫu phân cụm đồng đều

Giờ khi bạn đã quen với tác động của seed, hãy xem xét xu hướng thiên lệch của k-means về việc tạo các cụm có kích thước đồng đều.

Hãy dùng một bộ dữ liệu có hình “chuột” cho bài tập tiếp theo. Bộ dữ liệu này là một nhóm điểm trông giống đầu chuột: có ba cụm điểm sắp xếp thành các vòng tròn, lần lượt cho khuôn mặt và hai tai của con chuột.

Dưới đây là ví dụ một bộ dữ liệu hình chuột điển hình (Nguồn).

Dữ liệu được lưu trong một pandas DataFrame, mouse. x_scaled và y_scaled là tên các cột chứa tọa độ X và Y đã được chuẩn hóa của các điểm dữ liệu.

Hướng dẫn

100 XP
  • Import các hàm kmeans và vq trong SciPy.
  • Sinh các tâm cụm bằng hàm kmeans() với ba cụm.
  • Tạo nhãn cụm bằng vq() với các tâm cụm vừa sinh ở trên.