1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Phân cụm trong Python

Connected

Bài tập

Bắt gặp Pokémon: phân cụm phân cấp

Chúng ta sẽ tiếp tục điều tra các lần bắt gặp Pokémon huyền thoại từ bài tập trước. Hãy nhớ rằng trong biểu đồ scatter ở bài đó, bạn đã nhận ra hai khu vực có mật độ bắt gặp Pokémon cao. Điều này cho thấy các điểm dữ liệu tách thành hai cụm. Trong bài này, bạn sẽ tạo hai cụm cho các lần bắt gặp bằng phương pháp phân cụm phân cấp.

'x' và 'y' là các cột tọa độ X và Y của vị trí bắt gặp, được lưu trong một pandas DataFrame, df. Bạn có sẵn để sử dụng: matplotlib.pyplot là plt, seaborn là sns, và pandas là pd.

Hướng dẫn

100 XP
  • Import các thư viện linkage và fcluster.
  • Dùng hàm linkage() để tính khoảng cách theo phương pháp ward.
  • Tạo nhãn cụm cho từng điểm dữ liệu với hai cụm bằng hàm fcluster().
  • Vẽ các điểm bằng seaborn và gán màu khác nhau cho mỗi cụm.