1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Xử lý dữ liệu thiếu trong R

Connected

Bài tập

Bù dữ liệu dưới khoảng giá trị với dữ liệu nabular

Chúng ta muốn theo dõi các giá trị đã bù. Nếu không làm vậy, sẽ rất khó đánh giá độ tốt của các giá trị được bù.

Bạn sẽ luyện tập bù dữ liệu và dựng lại các trực quan trong bộ bài tập trước bằng cách bù các giá trị thấp hơn khoảng giá trị của dữ liệu.

Đây là cách rất hữu ích để tiếp tục khám phá tính thiếu, đồng thời cung cấp khuôn khổ để bù giá trị thiếu.

Trước hết, chúng ta sẽ bù dữ liệu dưới khoảng giá trị bằng impute_below_all(), rồi trực quan hóa dữ liệu. Mặc dù có thể thấy vị trí các giá trị thiếu trong trường hợp này, chúng ta vẫn cần cách để theo dõi chúng. Khuôn mẫu lập trình “theo dõi dữ liệu thiếu” sẽ giúp ích cho việc này.

Hướng dẫn

100 XP

Với dữ liệu oceanbuoys:

  • Bù dưới khoảng giá trị bằng impute_below_all().
  • Trực quan hóa các giá trị thiếu mới với wind_ew trên trục x và air_temp_c trên trục y.
  • Bù và theo dõi dữ liệu bằng bind_shadow(), impute_below_all(), và add_label_shadow().
  • Hiển thị biểu đồ và kiểm tra các giá trị đã bù.