1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Xử lý dữ liệu thiếu trong R

Connected

Bài tập

Đánh giá các phép điền khuyết kém chất lượng

Để đánh giá các phép điền khuyết (imputation), sẽ hữu ích nếu bạn biết một ví dụ “xấu” trông như thế nào. Để khám phá điều này, hãy xem một phương pháp điền khuyết thường không tốt: điền bằng giá trị trung bình.

Trong bài tập này, bạn sẽ tìm hiểu cách phương pháp điền trung bình hoạt động thông qua biểu đồ hộp, sử dụng bộ dữ liệu oceanbuoys.

Hướng dẫn

100 XP

Với bộ dữ liệu oceanbuoys:

  • Điền giá trị trung bình bằng impute_mean_all(), và theo dõi các giá trị đã điền bằng add_label_shadow().
  • Khám phá các giá trị đã điền ở độ ẩm (humidity) bằng biểu đồ hộp.
  • Khám phá các giá trị đã điền ở nhiệt độ không khí (air_temp_c) bằng biểu đồ hộp.