1. सीखें
  2. /
  3. पाठ्यक्रम
  4. /
  5. Pythonで学ぶ不正検知

Connected

अभ्यास

最適パラメータを見つけるための GridSearchCV

この演習では、モデルを「行き当たりばったり」ではなく、GridSearchCV を使って体系的にチューニングします。

GridSearchCV では、候補ごとにどの評価指標でスコアするかを指定できます。詐欺検知ではできるだけ多くの不正を見つけることが重要なので、モデル設定は再現率(Recall)を最大化するよう最適化できます。もし偽陽性も減らしたい場合は F1 スコアで最適化すると、Precision-Recall のバランスが取れます。

GridSearchCV はすでに sklearn.model_selection からインポートされています。さっそく試してみましょう!

निर्देश

100 XP
  • パラメータグリッドでは、木の本数として 1 と 30 を試し、分割基準として gini と entropy を試すように指定してください。
  • モデルはシンプルな RandomForestClassifier を使い、比較できるように random_state は 5 のままにします。
  • scoring オプションは再現率を最適化するように設定してください。
  • 学習データ X_train と y_train にフィットし、モデルの最良パラメータを取得してください。