1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Học có giám sát với scikit-learn

Connected

Bài tập

Cross-validation cho R-squared

Cross-validation là một cách tiếp cận quan trọng để đánh giá mô hình. Nó tối đa hóa lượng dữ liệu mà mô hình có thể sử dụng, vì mô hình không chỉ được huấn luyện mà còn được kiểm tra trên toàn bộ dữ liệu hiện có.

Trong bài tập này, bạn sẽ xây dựng một mô hình hồi quy tuyến tính, sau đó dùng cross-validation 6-fold để đánh giá độ chính xác khi dự đoán doanh số dựa trên chi tiêu quảng cáo trên mạng xã hội. Bạn sẽ hiển thị điểm số riêng lẻ cho từng fold trong sáu fold.

Bộ dữ liệu sales_df đã được tách sẵn thành y (biến mục tiêu) và X (các đặc trưng), và đã được tải sẵn cho bạn. LinearRegression đã được import từ sklearn.linear_model.

Hướng dẫn

100 XP
  • Import KFold và cross_val_score.
  • Tạo kf bằng cách gọi KFold(), đặt số lần chia là 6, shuffle là True, và đặt seed là 5.
  • Thực hiện cross-validation dùng reg trên X và y, truyền kf vào cv.
  • In cv_scores.