1. 学习
  2. /
  3. 课程
  4. /
  5. PythonでMachine Learningを使ってCTRを予測する

Connected

练习

モデル選択

正則化と交差検証は、モデル選択において非常に強力な手法です。正則化は過学習の防止に役立ち、交差検証はモデルが適切に評価されていることを保証します。この演習では、正則化と交差検証を組み合わせて、モデル間で有意な差があるかどうかを確認します。ここでは精度(precision)のみを計算しますが、同様の手順で再現率(recall)や他の評価指標にも簡単に応用できます。

X_train、y_train、X_test、y_test がワークスペースに用意されています。pandas は pd、numpy は np、sklearn も使用できます。sklearn.metrics の precision_score() と recall_score()、および sklearn.model_selection の KFold() と cross_val_score() も利用可能です。

说明

100 XP
  • n_splits を使って分割数を4にしたK-Fold交差検証を設定し、k-fold に代入します。
  • 決定木分類器を作成します。
  • k_fold を使って交差検証を実行し、指定された max_depth の値に対する決定木モデルの精度(precision)と再現率(recall)を評価します。