1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Dự đoán CTR với Machine Learning trong Python

Connected

Bài tập

Cross validation

Cross validation là một kỹ thuật nhằm kiểm tra hiệu năng holdout của mô hình. Mục tiêu là đảm bảo kết quả kiểm thử không bị ảnh hưởng bởi cách chia dữ liệu cụ thể. Trong bài tập này, bạn sẽ dùng các hàm từ sklearn để chạy K-fold cross validation bằng KFold() nhằm đánh giá precision và recall cho một decision tree.

X_train, y_train, X_test, y_test đã có trong workspace của bạn. pandas là pd, numpy là np, và sklearn cũng đã sẵn sàng. KFold() và cross_val_score() từ sklearn.model_selection cũng đều có sẵn.

Hướng dẫn

100 XP
  • Tạo một bộ phân loại decision tree.
  • Thiết lập K-Fold cross validation với bốn lần chia và gán vào k-fold.
  • Dùng k_fold để chạy cross validation với cross_val_score() nhằm đánh giá precision và recall của mô hình (không dùng recall_score() hay precision_score()!).