1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Tiền xử lý cho Machine Learning bằng Python

Connected

Bài tập

Mã hóa biến phân loại - one-hot

Một trong các cột của tập dữ liệu volunteer, category_desc, cung cấp mô tả hạng mục cho các cơ hội tình nguyện được liệt kê. Vì đây là một biến phân loại với nhiều hơn hai hạng mục, bạn cần dùng one-hot encoding để biến đổi cột này thành dạng số. Hãy dùng hàm pd.get_dummies() của pandas để thực hiện.

Hướng dẫn

100 XP
  • Gọi get_dummies() trên cột volunteer["category_desc"] để tạo các cột đã mã hóa và gán vào category_enc.
  • In .head() của biến category_enc để xem nhanh các cột đã mã hóa.