1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Giảm Chiều Dữ Liệu với R

Connected

Bài tập

Tạo bộ lọc theo tỷ lệ giá trị khuyết

Data frame house_sales_df chứa biến đích price và nhiều biến dự báo mô tả từng căn nhà, ảnh hưởng đến giá bán của chúng. Một số thuộc tính có số lượng giá trị khuyết khác nhau. Nếu tỷ lệ giá trị khuyết quá cao, thuộc tính đó sẽ không cung cấp nhiều thông tin để dự đoán giá nhà. Những thuộc tính này có thể bị loại bỏ. Trong bài tập này, bạn sẽ tính tỷ lệ giá trị khuyết cho từng cột. Điều này sẽ giúp bạn nghĩ về ngưỡng phù hợp cho mỗi cột.

Gói tidyverse đã được nạp sẵn cho bạn.

Hướng dẫn

100 XP
  • Lưu tổng số hàng trong house_sales_df vào n.
  • Tính tỷ lệ giá trị khuyết cho từng cột trong house_sales_df và lưu vào missing_vals_df.