1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Feature Engineering cho Machine Learning bằng Python

Connected

Bài tập

Chuẩn hóa (Normalization)

Như đã đề cập trong video, với normalization, bạn co giãn tuyến tính toàn bộ cột dữ liệu về khoảng từ 0 đến 1, trong đó 0 ứng với giá trị nhỏ nhất của cột và 1 ứng với giá trị lớn nhất.
Khi dùng scikit-learn (thư viện machine learning phổ biến nhất trong Python), bạn có thể dùng MinMaxScaler để áp dụng normalization. (Tên gọi này xuất phát từ việc nó co giãn các giá trị của bạn về giữa giá trị nhỏ nhất và lớn nhất.)

Hướng dẫn

100 XP
  • Import MinMaxScaler từ module preprocessing của sklearn.
  • Khởi tạo MinMaxScaler() và gán vào MM_scaler.
  • Fit MinMaxScaler trên cột Age của so_numeric_df.
  • Transform cùng cột đó bằng scaler bạn vừa fit.