1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Phân cụm trong Python

Connected

Bài tập

Phương pháp khuỷu tay trên dữ liệu phân bố đều

Ở bài trước, bạn đã vẽ biểu đồ khuỷu tay (elbow plot) cho dữ liệu có cụm được xác định rõ. Giờ hãy xem biểu đồ khuỷu tay trông như thế nào với một tập dữ liệu có các điểm phân bố đều. Bạn có thể muốn hiển thị các điểm dữ liệu trước khi làm bài.

Dữ liệu được lưu trong một pandas DataFrame, uniform_data. x_scaled và y_scaled là tên các cột chứa toạ độ X và Y đã được chuẩn hoá của các điểm.

Hướng dẫn 1/2

undefined XP
    1
    2
  • Tạo danh sách các giá trị méo (distortions) cho từng số cụm trong num_clusters.
  • Tạo DataFrame elbow_plot với num_clusters và distortions.
  • Dùng phương thức .lineplot() để vẽ elbow_plot với num_clusters trên trục x và distortions trên trục y.