1. 学习
  2. /
  3. 课程
  4. /
  5. Chinh phục cuộc thi Kaggle bằng Python

Connected

练习

Tái tạo điểm xác thực

Bạn đã thấy cả điểm xác thực và điểm trên Public Leaderboard trong video. Tuy nhiên, ví dụ mã chỉ có cho dữ liệu kiểm tra. Để có được điểm xác thực, bạn cần lặp lại cùng quy trình trên tập holdout.

Trong cả chương này, bạn sẽ làm việc với dữ liệu cuộc thi New York City Taxi. Bài toán là dự đoán tiền cước cho một chuyến taxi ở New York City. Thước đo của cuộc thi là sai số căn phương bình phương trung bình (root mean squared error).

Mục tiêu đầu tiên là đánh giá mô hình Baseline trên dữ liệu xác thực. Bạn sẽ tái tạo Baseline đơn giản nhất dựa trên giá trị trung bình của "fare_amount". Hãy nhớ rằng chiến lược xác thực chúng ta dùng là tách holdout 30% với validation_train làm tập huấn luyện và validation_test làm DataFrame holdout. Cả hai đều có sẵn trong môi trường làm việc của bạn.

说明

100 XP
  • Tính giá trị trung bình của "fare_amount" trên toàn bộ DataFrame validation_train.
  • Gán giá trị dự đoán ngây thơ này cho tất cả dự đoán trên holdout. Lưu chúng vào cột "pred".