1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Feature Engineering cho Machine Learning bằng Python

Connected

Bài tập

Biến đổi trên train và test (II)

Tương tự như việc áp dụng cùng một scaler cho cả tập train và test, nếu bạn đã loại bỏ các điểm ngoại lai khỏi tập train, bạn cũng sẽ muốn làm điều tương tự với tập test. Một lần nữa, bạn cần đảm bảo chỉ dùng các ngưỡng được tính từ tập train để loại bỏ ngoại lai trên tập test.

Tương tự bài trước, chúng ta đã tách DataFrame so_numeric_df thành tập train (so_train_numeric) và tập test (so_test_numeric).

Hướng dẫn

100 XP
  • Tính độ lệch chuẩn và giá trị trung bình của cột ConvertedSalary.
  • Tính các ngưỡng trên và dưới là ba độ lệch chuẩn lệch khỏi trung bình theo cả hai phía.
  • Cắt gọn DataFrame so_test_numeric để chỉ giữ lại những hàng có ConvertedSalary nằm trong khoảng giữa hai ngưỡng trên và dưới.