1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Thiết kế thí nghiệm với R

Connected

Bài tập

Xử lý điểm kiểm tra bị thiếu

Nếu muốn dùng điểm SAT làm biến kết quả, bạn cần kiểm tra dữ liệu bị thiếu. Hãy xem mô hình thiếu dữ liệu của tất cả biến trong nyc_scores bằng miss_var_summary() từ gói naniar. naniar tích hợp tốt với phong cách mã Tidyverse, bao gồm cả toán tử pipe (%>%).

Có 60 điểm bị thiếu ở mỗi môn. Dù có nhiều gói R hỗ trợ các phương pháp nội suy nâng cao như MICE, Amelia và mi, ở đây chúng ta sẽ tiếp tục dùng simputation và impute_median().

Tạo một bộ dữ liệu mới, nyc_scores_2, bằng cách nội suy (impute) điểm Toán theo Borough, nhưng lưu ý rằng impute_median() trả về biến đã nội suy với kiểu "impute". Bạn sẽ chuyển biến này sang kiểu số ở bước riêng.

simputation và dplyr đã được nạp.

Hướng dẫn 1/4

undefined XP
    1
    2
    3
    4
  • Nạp gói naniar.
  • Kiểm tra dữ liệu bị thiếu của các biến trong nyc_scores bằng cách pipe sang miss_var_summary().