1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Tiền xử lý cho Machine Learning bằng Python

Connected

Bài tập

Mã hóa biến phân loại

Có một vài cột trong bộ dữ liệu UFO cần được mã hóa trước khi có thể đưa vào mô hình với scikit-learn. Ở đây, bạn sẽ thực hiện bước biến đổi đó bằng cả hai phương pháp: mã hóa nhị phân và one-hot.

Hướng dẫn

100 XP
  • Dùng apply(), viết một hàm lambda có điều kiện trả về 1 nếu giá trị là "us", ngược lại trả về 0.
  • In ra số lượng giá trị .unique() trong cột type.
  • Dùng pd.get_dummies() để tạo một tập one-hot encoded cho cột type.
  • Cuối cùng, dùng pd.concat() để nối các biến đã mã hóa type_set vào bộ dữ liệu ufo.