1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Phân tích Marketing: Dự đoán Khách hàng Rời bỏ bằng Python

Connected

Bài tập

Mã hóa đặc trưng nhị phân

Chuyển đổi kiểu dữ liệu là một phần quan trọng của tiền xử lý dữ liệu. Trong bài này, bạn sẽ gán giá trị 1 cho 'yes' và 0 cho 'no' tương ứng cho hai đặc trưng 'Vmail_Plan' và 'Churn'.

Bạn đã thấy hai cách làm trong video — một cách dùng pandas, và cách còn lại dùng scikit-learn. Với những tác vụ đơn giản như thế này, nên ưu tiên pandas, và đó cũng là cách chúng ta sẽ làm trong bài tập này. Còn nếu bạn đang xây dựng các pipeline Machine Learning — điều nằm ngoài phạm vi khóa học — bạn có thể cân nhắc dùng LabelEncoder(). Khi làm data science, điều quan trọng là hiểu rằng luôn có nhiều hơn một cách để hoàn thành một tác vụ, và bạn cần chọn cách hiệu quả nhất cho ứng dụng của mình.

Hướng dẫn

100 XP
  • Thay 'no' bằng 0 và 'yes' bằng 1 trong cột 'Vmail_Plan' của telco.
  • Thực hiện tương tự cho cột 'Churn'.