1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Machine Learning cho Marketing với Python

Connected

Bài tập

Mã hóa biến phân loại và chuẩn hóa biến số

Ở bước cuối cùng này, bạn sẽ thực hiện one-hot encoding cho các biến phân loại và sau đó chuẩn hóa các cột số. Thư viện pandas đã được nạp sẵn dưới tên pd, cùng với mô-đun StandardScaler từ mô-đun sklearn.preprocessing.

Bộ dữ liệu churn viễn thông thô telco_raw đã được nạp sẵn dưới dạng DataFrame của pandas, cùng với các danh sách custid, target, categorical và numerical chứa tên cột mà bạn đã tạo ở bài tập trước. Bạn có thể làm quen với bộ dữ liệu bằng cách khám phá nó trong console.

Hướng dẫn

100 XP
  • Thực hiện one-hot encoding cho các biến phân loại.
  • Khởi tạo một đối tượng StandardScaler.
  • Fit và transform scaler trên các cột số.
  • Tạo một DataFrame từ scaled_numerical.