1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Các Mô hình Hỗn hợp trong R

Connected

Bài tập

Trực quan hóa các cụm

Đến đây, bạn đã có đủ mọi thứ để vẽ các điểm quan sát cùng với các ellipse biểu diễn các cụm.

Ngoài ra, nếu muốn gán mỗi quan sát vào một trong hai cụm, bạn có thể dùng hàm clusters() và so sánh kết quả với nhãn thật. Nhắc lại: khi chỉ dùng biến Weight để phân cụm dữ liệu, chúng ta đã dự đoán đúng 4500 nữ và 4556 nam. Hãy xem liệu việc bổ sung thêm một biến có giúp tách các cụm tốt hơn không.

Hướng dẫn

100 XP
  • Dùng geom_point() để vẽ biểu đồ phân tán cho Weight và BMI. Thêm vào biểu đồ này hai ellipse đã lưu trong ellipses_comp_number bằng hàm geom_path().
  • Lưu ý: cần chuyển các ellipse thành một data frame.
  • Tô màu cụm 1 là đỏ và cụm 2 là xanh dương.
  • Tính bảng tần suất cho nhãn thật lưu trong biến Gender so với nhãn dự đoán ước lượng bởi clusters.