1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Xử lý dữ liệu khuyết bằng Imputation trong R

Connected

Bài tập

Ngửi thấy rủi ro của phép nội suy theo trung bình

Một trong những phương pháp nội suy phổ biến nhất là nội suy theo trung bình, trong đó các giá trị thiếu của một biến được thay bằng giá trị trung bình của các quan sát hiện có của biến đó. Tuy nhiên, trong nhiều trường hợp, cách làm đơn giản này lại là lựa chọn tệ. Đôi khi chỉ cần nhìn qua dữ liệu cũng đủ cảnh báo bạn về những nguy cơ khi nội suy bằng trung bình.

Trong chương này, bạn sẽ làm việc với một mẫu con của dữ liệu dự án Tropical Atmosphere Ocean (tao). Bộ dữ liệu gồm các phép đo khí quyển được thu thập ở hai giai đoạn thời gian khác nhau tại năm địa điểm. Dữ liệu đi kèm với gói VIM.

Trong bài tập này, bạn sẽ làm quen với dữ liệu và thực hiện một phân tích đơn giản để chỉ ra hậu quả có thể có của việc nội suy theo trung bình. Hãy cùng xem dữ liệu tao nhé!

Hướng dẫn 1/3

undefined XP
    1
    2
    3
  • Xem 10 hàng đầu tiên của dữ liệu tao và làm quen với các biến.