1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Chinh phục cuộc thi Kaggle bằng Python

Connected

Bài tập

Thử nghiệm các ý tưởng từ Kaggle Forum

Đáng tiếc là không phải mọi bài viết trên Forum và Kernel đều hữu ích cho mô hình của bạn. Vì vậy, thay vì đưa ý tưởng vào pipeline một cách mù quáng, bạn nên thử nghiệm trước.

Bạn được cung cấp hàm get_cv_score(), nhận vào tập dữ liệu train và trả về lỗi căn bậc hai trung bình (RMSE) trên xác thực chéo 3-fold. DataFrame train đã có sẵn trong môi trường làm việc của bạn.

Bạn hãy thử các gợi ý khác nhau từ Kaggle Forum và kiểm tra xem chúng có cải thiện điểm xác thực của bạn không.

Hướng dẫn 1/2

undefined XP
  • 1
    • Gợi ý 1: passenger_count là đặc trưng vô ích. Thử xem! Hãy loại bỏ đặc trưng này và so sánh điểm số.
  • 2
    • Gợi ý đầu tiên có hiệu quả. Gợi ý 2: Tổng của pickup_latitude và distance_km là một đặc trưng tốt. Hãy thử nhé!