1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Thiết kế quy trình Machine Learning bằng Python

Connected

Bài tập

Mã hóa biến phân loại

Đồng nghiệp của bạn đã chuyển các cột trong bộ dữ liệu tín dụng sang giá trị số bằng LabelEncoder(). Anh ấy bỏ sót một cột: credit_history, ghi nhận lịch sử tín dụng của người nộp đơn. Bạn muốn tạo hai phiên bản của bộ dữ liệu. Một phiên bản dùng LabelEncoder() và một phiên bản dùng one-hot encoding để so sánh. Ma trận đặc trưng đã có sẵn dưới tên credit. Bạn đã có LabelEncoder() được nạp sẵn và pandas là pd.

Hướng dẫn

100 XP
  • Mã hóa credit_history bằng LabelEncoder().
  • Nối kết quả vào khung dữ liệu gốc.
  • Tạo một khung dữ liệu mới bằng cách nối các biến giả (1-hot encoding dummies) vào khung gốc.
  • Xác nhận rằng one-hot encoding tạo ra nhiều cột hơn so với label encoding.