1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Phân cụm trong Python

Connected

Bài tập

Phân cụm k-means: bài tập đầu tiên

Bài tập này giúp bạn làm quen với cách dùng phân cụm k-means trên một tập dữ liệu. Hãy dùng bộ dữ liệu Comic Con và xem k-means hoạt động như thế nào trên đó.

Nhắc lại hai bước của phân cụm k-means:

  • Xác định tâm cụm bằng hàm kmeans(). Hàm này có hai đối số bắt buộc: dữ liệu quan sát và số cụm.
  • Gán nhãn cụm bằng hàm vq(). Hàm này có hai đối số bắt buộc: dữ liệu quan sát và các tâm cụm.

Dữ liệu được lưu trong pandas DataFrame, comic_con. x_scaled và y_scaled là tên các cột tọa độ X và Y đã được chuẩn hóa của mọi người tại một thời điểm nhất định.

Hướng dẫn

100 XP
  • Import các hàm kmeans và vq trong SciPy.
  • Tạo các tâm cụm bằng hàm kmeans() với hai cụm.
  • Tạo nhãn cụm dựa trên các tâm cụm này.