1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Dự đoán CTR với Machine Learning trong Python

Connected

Bài tập

Chuẩn hóa chuẩn (Standard scaling)

Chuẩn hóa chuẩn sẽ biến đổi các đặc trưng số sao cho có trung bình bằng 0 và phương sai bằng 1. Trong bài tập này, bạn sẽ thực hiện chuẩn hóa chuẩn bằng StandardScaler() từ sklearn. Trước hết, bạn sẽ chỉ chọn các cột phù hợp để áp dụng chuẩn hóa, bằng cách kết hợp lọc các cột số với một chút hiểu biết về các cột. Việc lọc này đã được cung cấp sẵn và sẽ được thực hiện thông qua biểu thức chính quy, cho phép khớp một phần chuỗi. Sau đó, bạn sẽ dùng fit_transform() để biến đổi các cột liên quan.

Mô-đun pandas đã có sẵn với tên pd trong không gian làm việc của bạn và DataFrame mẫu đã được nạp với tên df. Ngoài ra, cột hour đã được chuyển sang kiểu datetime, và StandardScaler từ sklearn.preprocessing cũng đã sẵn sàng.

Hướng dẫn

100 XP
  • Chọn các cột kiểu số và lọc filter_cols đã cho bằng .select_dtypes().
  • Áp dụng chuẩn hóa chuẩn cho các cột liên quan bằng cách tạo một StandardScaler() rồi dùng .fit_transform().
  • In phương sai của các cột vừa được biến đổi bằng .var().