1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Tiền xử lý cho Machine Learning bằng Python

Connected

Bài tập

Xác định các đặc trưng cần được chuẩn hóa

Trong bài tập này, bạn sẽ khảo sát phương sai của các cột trong bộ dữ liệu UFO để quyết định đặc trưng nào cần được chuẩn hóa. Sau khi xem phương sai của các cột seconds và minutes, bạn sẽ thấy phương sai của cột seconds cực kỳ cao. Vì seconds và minutes có liên quan với nhau (một vấn đề chúng ta sẽ xử lý khi chọn đặc trưng cho mô hình), hãy log normalize cột seconds.

Hướng dẫn

100 XP
  • Tính phương sai của các cột seconds và minutes và xem kỹ kết quả.
  • Thực hiện log normalization trên cột seconds, biến đổi nó thành một cột mới tên là seconds_log.
  • In ra phương sai của cột seconds_log.