1. Learn
  2. /
  3. Courses
  4. /
  5. Xử lý dữ liệu thiếu trong R

Connected

Exercise

Tóm tắt theo nhóm về mức độ thiếu dữ liệu

Giờ bạn đã có thể tạo dữ liệu nabular, hãy dùng nó để khám phá dữ liệu. Ta sẽ tính các thống kê tóm tắt dựa trên mức độ thiếu của một biến khác.

Để làm điều này, ta sẽ thực hiện các bước sau:

  • Đầu tiên, bind_shadow() biến dữ liệu thành dữ liệu nabular.

  • Tiếp theo, thực hiện một số phép tóm tắt trên dữ liệu bằng group_by() và summarize() để tính trung bình và độ lệch chuẩn, dùng các hàm mean() và sd().

Instructions

100 XP
  • Với bộ dữ liệu oceanbuoys:

  • Gọi bind_shadow(), rồi group_by() theo tình trạng thiếu của humidity (humidity_NA) và tính trung bình cùng độ lệch chuẩn cho gió đông tây (wind_ew) bằng summarize() từ dplyr.

  • Lặp lại, nhưng tính các tóm tắt cho gió bắc nam (wind_ns).