1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Xử lý dữ liệu khuyết bằng Imputation trong R

Connected

Bài tập

Nội suy dựa trên mô hình với nhiều kiểu biến

Bạn đã làm rất tốt khi viết hàm để nội suy bằng hồi quy logistic kèm bước rút mẫu từ phân phối có điều kiện. Đó là phần thống kê khá nâng cao mà bạn đã mã hóa đấy! Trong bài tập này, bạn sẽ kết hợp những gì đã học về nội suy dựa trên mô hình để nội suy cho các kiểu biến khác nhau trong dữ liệu tao.

Nhiệm vụ của bạn là lặp qua các biến giống như bạn đã làm ở chương trước và nội suy cho hai biến:

  • is_hot, một biến nhị phân mới được tạo từ air_temp, bằng 1 nếu air_temp lớn hơn hoặc bằng 26 độ và bằng 0 nếu không;
  • humidity, một biến liên tục mà bạn đã quen thuộc.

Bạn sẽ cần dùng hàm hồi quy tuyến tính đã học trước đó, cùng với chính hàm hồi quy logistic mà bạn đã viết. Bắt đầu thôi!

Hướng dẫn

100 XP
  • Gán is_hot thành NA tại những vị trí ban đầu nó bị thiếu.
  • Nội suy is_hot bằng hồi quy logistic, dùng sea_surface_temp làm biến dự báo duy nhất; sử dụng hàm impute_logreg() của bạn.
  • Gán humidity thành NA tại những vị trí ban đầu nó bị thiếu.
  • Nội suy humidity bằng hồi quy tuyến tính, dùng sea_surface_temp và air_temp làm các biến dự báo.