1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Feature Engineering cho Machine Learning bằng Python

Connected

Bài tập

Nhị phân hóa các cột

Mặc dù nhiều giá trị số có thể dùng trực tiếp mà không cần kỹ thuật đặc trưng, đôi khi việc thao tác một chút sẽ hữu ích. Ví dụ, có những lúc bạn không quan tâm đến độ lớn của giá trị mà chỉ quan tâm đến hướng, hoặc chỉ cần biết nó có tồn tại hay không. Trong những tình huống này, bạn sẽ muốn nhị phân hóa một cột. Trong dữ liệu so_survey_df, có một lượng lớn người tham gia khảo sát đang làm việc tự nguyện (không lương). Bạn sẽ tạo một cột mới tên Paid_Job cho biết mỗi người có được trả lương hay không (mức lương của họ lớn hơn 0).

Hướng dẫn

100 XP
  • Tạo một cột mới tên Paid_Job và điền giá trị 0.
  • Thay tất cả giá trị Paid_Job thành 1 tại những hàng có ConvertedSalary lớn hơn 0.