1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Giảm Chiều Dữ Liệu với Python

Connected

Bài tập

Các thuộc tính có phương sai thấp

Trong bài trước, bạn đã xác định rằng 0.001 là một ngưỡng phù hợp để lọc bỏ các thuộc tính có phương sai thấp trong head_df sau khi chuẩn hóa. Giờ hãy dùng bộ chọn thuộc tính VarianceThreshold để loại các thuộc tính này.

Hướng dẫn

100 XP
  • Tạo bộ chọn variance threshold với ngưỡng 0.001.
  • Chuẩn hóa DataFrame head_df bằng cách chia cho giá trị trung bình của từng cột rồi fit bộ chọn.
  • Tạo một mask boolean từ bộ chọn bằng .get_support().
  • Tạo một DataFrame rút gọn bằng cách truyền mask vào phương thức .loc[].