1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Làm việc với dữ liệu phân loại trong Python

Connected

Bài tập

One-hot encoding cho các cột cụ thể

Một đại lý xe cũ địa phương muốn bạn hỗ trợ dự đoán giá bán của xe. Nếu bạn áp dụng one-hot encoding cho toàn bộ dữ liệu used_cars, tập dữ liệu mới sẽ có hơn 1.200 cột. Bạn lo ngại điều này có thể gây ra vấn đề khi huấn luyện các mô hình Machine Learning để dự đoán giá. Bạn quyết định thử một cách đơn giản hơn và chỉ áp dụng one-hot encoding cho một vài cột.

Hướng dẫn

100 XP
  • Tạo một tập dữ liệu mới, used_cars_simple, với one-hot encoding cho các cột sau: "manufacturer_name" và "transmission" (theo thứ tự này).
  • Đặt tiền tố của tất cả các cột mới là "dummy", để bạn có thể dễ dàng lọc các cột vừa được tạo.