1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Xử lý Dữ liệu Khuyết trong Python

Connected

Bài tập

Mã hóa thứ bậc cho DataFrame

Các đặc trưng kiểu phân loại có thể được mã hóa bằng hai kỹ thuật: one-hot encoding và ordinal encoding. Với one-hot encoding, mỗi hạng mục trở thành một cột; với mỗi hàng, cột ứng với hạng mục đó có giá trị 1, các cột còn lại là 0. Với ordinal encoding, các hạng mục được ánh xạ thành các giá trị nguyên bắt đầu từ 0 đến số lượng hạng mục.

Trong bài tập này, bạn sẽ lặp qua tất cả các cột trong DataFrame users để mã hóa thứ bậc các hạng mục. Bạn cũng sẽ lưu một encoder cho từng cột trong từ điển ordinal_enc_dict để có thể chuyển các cột đã mã hóa về lại hạng mục gốc.

Hướng dẫn

100 XP
  • Khai báo một từ điển rỗng ordinal_enc_dict.
  • Tạo một đối tượng Ordinal Encoder cho mỗi cột.
  • Chọn các giá trị khác null của cột trong users và mã hóa chúng.
  • Gán lại các giá trị đã mã hóa vào các giá trị khác null của từng cột (col_name) trong users.