1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Giảm Chiều Dữ Liệu với R

Connected

Bài tập

Áp dụng bộ lọc theo tỷ lệ giá trị thiếu

Giờ bạn đã tính được tỷ lệ giá trị thiếu, bạn có thể tạo một bộ lọc dựa trên ngưỡng giá trị thiếu. Trong bài này, chúng ta sẽ chọn một ngưỡng tỷ lệ giá trị thiếu tùy ý nhưng hợp lý và áp dụng cho tất cả các cột. Trong thực tế, bạn sẽ cân nhắc kỹ và tùy chỉnh ngưỡng cho từng đặc trưng.

missing_vals_df chứa các tỷ lệ bạn đã tính ở bài trước và khung dữ liệu house_sales_df đều đã sẵn sàng để bạn sử dụng. Gói tidyverse cũng đã được nạp sẵn cho bạn.

Hướng dẫn

100 XP
  • Dùng missing_vals_df và ngưỡng 0.5 để tạo bộ lọc theo tỷ lệ giá trị thiếu và lưu vào missing_vals_filter.
  • Áp dụng missing_vals_df lên house_sales_df để giảm số chiều và lưu khung dữ liệu mới vào filtered_house_sales_df.