1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Xử lý dữ liệu khuyết bằng Imputation trong R

Connected

Bài tập

Đánh giá chất lượng thế giá trị bằng biểu đồ biên (margin plot)

Ở bài trước, bạn đã thế giá trị trung bình cho air_temp và thêm một biến chỉ báo để đánh dấu các giá trị đã được thế, gọi là air_temp_imp. Đến lúc xem cách làm này hiệu quả ra sao.

Khi xem xét dữ liệu tao, bạn có thể nhận thấy nó còn có biến sea_surface_temp, nhiều khả năng có tương quan dương với air_temp. Nếu đúng vậy, bạn kỳ vọng hai nhiệt độ này sẽ cùng cao hoặc cùng thấp tại cùng một thời điểm. Thế nhiệt độ không khí bằng giá trị trung bình khi nhiệt độ bề mặt biển đang rất cao hoặc rất thấp sẽ phá vỡ mối quan hệ này.

Để kiểm tra, trong bài này bạn sẽ chọn hai biến nhiệt độ và biến chỉ báo, rồi dùng chúng để vẽ một biểu đồ biên. Hãy đánh giá phương pháp thế giá trị trung bình!

Hướng dẫn 1/2

undefined XP
    1
    2
  • Dùng select() chỉ lấy air_temp, sea_surface_temp và air_temp_imp theo đúng thứ tự đó từ tao_imp.
  • Truyền các biến đã chọn vào hàm phù hợp để tạo biểu đồ biên, đồng thời thiết lập đối số delimiter cho phù hợp.