1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Hồi quy trung cấp với R

Connected

Bài tập

Trực quan hóa nhiều biến

Khi bạn bắt đầu cân nhắc nhiều biến hơn, việc vẽ tất cả chúng cùng lúc sẽ ngày càng khó. Bên cạnh việc dùng trục x và y cho hai biến số, bạn có thể dùng màu cho biến số thứ ba, và dùng chia ô (faceting) cho các biến phân loại. Và đó gần như là giới hạn trước khi biểu đồ trở nên quá khó để diễn giải. Có một số dạng biểu đồ chuyên biệt như heatmap tương quan và biểu đồ tọa độ song song có thể xử lý nhiều biến hơn, nhưng chúng cung cấp ít thông tin hơn về từng biến và không phù hợp lắm để trực quan hóa dự đoán của mô hình.

Ở đây, bạn sẽ đẩy scatter plot đến giới hạn bằng cách hiển thị giá nhà, khoảng cách đến ga MRT, số cửa hàng tiện lợi gần đó và tuổi nhà, tất cả trong một biểu đồ.

taiwan_real_estate đã sẵn sàng; ggplot2 đã được nạp.

Hướng dẫn

100 XP
  • Sử dụng bộ dữ liệu taiwan_real_estate, vẽ scatter plot của n_convenience theo căn bậc hai của dist_to_mrt_m, tô màu theo price_twd_msq.
  • Dùng thang màu liên tục viridis plasma.
  • Chia ô biểu đồ (facet), chia theo house_age_years.