1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Tiền xử lý cho Machine Learning bằng Python

Connected

Bài tập

Tổng hợp đặc trưng số

Một trường hợp điển hình để lấy thống kê tổng hợp nhằm tạo đặc trưng mới là khi bạn có nhiều đặc trưng với các giá trị tương tự, liên quan đến nhau. Ở đây, bạn có một DataFrame thời gian chạy tên là running_times_5k. Với mỗi name trong tập dữ liệu, hãy lấy giá trị trung bình của 5 lần chạy của họ.

Hướng dẫn

100 XP
  • Dùng phương thức .loc[] để chọn tất cả các hàng và cột, rồi tìm .mean() của từng cột.
  • In .head() của DataFrame để xem cột mean.