1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Dự đoán CTR với Machine Learning trong Python

Connected

Bài tập

Chọn mô hình

Regularization và cross validation đều là các công cụ mạnh mẽ để chọn mô hình. Regularization giúp tránh overfitting, còn cross validation đảm bảo mô hình của bạn được đánh giá đúng cách. Trong bài này, bạn sẽ dùng regularization và cross validation cùng nhau và xem các mô hình có khác biệt đáng kể hay không. Bạn sẽ chỉ tính precision, dù rằng bạn có thể dễ dàng làm tương tự cho recall và các chỉ số đánh giá khác.

X_train, y_train, X_test, y_test đã có sẵn trong workspace. pandas là pd, numpy là np, và sklearn cũng đã sẵn sàng. precision_score() và recall_score() từ sklearn.metrics đều có sẵn, cũng như KFold() và cross_val_score() từ sklearn.model_selection.

Hướng dẫn

100 XP
  • Thiết lập K-Fold cross validation với bốn phần chia bằng n_splits và gán vào k-fold.
  • Tạo một mô hình decision tree classifier.
  • Dùng k_fold để chạy cross validation và đánh giá precision và recall của mô hình decision tree với giá trị max_depth đã cho.