1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Xử lý dữ liệu khuyết bằng Imputation trong R

Connected

Bài tập

Biểu đồ cột sống (spine plot)

Biểu đồ tổng hợp bạn đã vẽ ở bài trước cho bạn cái nhìn tổng quan ở mức cao về dữ liệu thiếu. Nếu bạn quan tâm đến sự tương tác giữa các biến cụ thể, spine plot là lựa chọn phù hợp. Nó cho phép bạn xem tỷ lệ phần trăm giá trị thiếu của một biến theo các giá trị khác nhau của biến còn lại, về mặt khái niệm rất giống với các phép t-test bạn đã thực hiện trong bài học trước.

Trong bài này, bạn sẽ vẽ một spine plot để khảo sát tỷ lệ phần trăm dữ liệu thiếu ở earnings theo các nhóm sub_race khác nhau. Liệu có nhiều dữ liệu thiếu về thu nhập hơn ở một số chủng tộc nhất định của nhân vật chính trong phim không? Hãy cùng tìm hiểu! Gói VIM đã được nạp sẵn cho bạn.

Hướng dẫn 1/2

undefined XP
    1
    2
  • Vẽ một spine plot để trực quan hóa tỷ lệ phần trăm giá trị thiếu trong earnings cho từng nhóm của sub_race bằng cách trước tiên chọn các biến theo đúng thứ tự rồi truyền chúng vào hàm vẽ phù hợp.