1. Aprende
  2. /
  3. Cursos
  4. /
  5. Học không giám sát với R

Connected

Ejercicio

Phân cụm k-means và so sánh kết quả

Như bạn đã biết, có hai loại phân cụm chính: phân cấp (hierarchical) và k-means.

Trong bài tập này, bạn sẽ tạo một mô hình phân cụm k-means trên dữ liệu ung thư vú Wisconsin và so sánh kết quả với chẩn đoán thực tế cũng như với mô hình phân cụm phân cấp mà bạn đã xây dựng. Hãy dành thời gian quan sát cách mỗi mô hình phân cụm tách hai loại chẩn đoán và cách chúng so sánh với nhau.

Instrucciones

100 XP

wisc.data, diagnosis, và wisc.hclust.clusters vẫn còn sẵn sàng.

  • Tạo một mô hình k-means trên wisc.data, gán kết quả vào wisc.km. Nhớ tạo 2 cụm tương ứng với số lượng chẩn đoán thực tế. Đồng thời, hãy chuẩn hóa dữ liệu và lặp thuật toán 20 lần để tìm mô hình hoạt động tốt.
  • Dùng hàm table() để so sánh thành viên cụm của mô hình k-means với chẩn đoán thực tế trong vector diagnosis. k-means tách hai chẩn đoán tốt đến mức nào?
  • Dùng hàm table() để so sánh thành viên cụm của mô hình k-means với mô hình phân cụm phân cấp. Nhớ rằng thành viên cụm của mô hình phân cụm phân cấp nằm trong wisc.hclust.clusters.