1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Chinh phục cuộc thi Kaggle bằng Python

Connected

Bài tập

Vượt ra ngoài phân loại nhị phân

Tất nhiên, phân loại nhị phân chỉ là một trường hợp đặc biệt. Target encoding có thể áp dụng cho bất kỳ kiểu biến đích nào:

  • Với phân loại nhị phân, thường dùng mean target encoding
  • Với hồi quy, có thể thay mean bằng median, các tứ phân vị, v.v.
  • Với phân loại đa lớp, với N lớp ta tạo N đặc trưng mang giá trị trung bình mục tiêu cho từng hạng mục theo kiểu one-vs-all

Hàm mean_target_encoding() bạn đã tạo có thể dùng cho mọi kiểu biến đích như trên. Hãy áp dụng nó cho bài toán hồi quy với ví dụ từ cuộc thi House Prices trên Kaggle.

Mục tiêu của bạn là mã hóa đặc trưng phân loại "RoofStyle" bằng mean target encoding. Các DataFrame train và test đã có sẵn trong môi trường làm việc của bạn.

Hướng dẫn

100 XP
  • Chỉ định tất cả các tham số còn thiếu khi gọi hàm mean_target_encoding(). Tên biến đích là "SalePrice". Đặt siêu tham số \(\alpha\) bằng 10.
  • Nhớ rằng các tham số train và test mong đợi các DataFrame train và test.
  • Trong khi đó, các tham số target và categorical mong đợi tên của biến đích và đặc trưng cần mã hóa.