1. 学ぶ
  2. /
  3. コース
  4. /
  5. マーケティングアナリティクス:Pythonで顧客解約を予測する

Connected

演習

特徴量数のチューニング

モデルで使われるデフォルトのハイパーパラメータは、皆さんのデータに最適化されていません。グリッドサーチ交差検証の目的は、モデル性能を最大化するハイパーパラメータを見つけることです。動画では、ランダムフォレストの n_estimators ハイパーパラメータのチューニング方法を見ました。ここでは、max_features ハイパーパラメータのチューニングを練習します。コードを素早く実行するため、cv ハイパーパラメータは 3 に設定されています。

Hyperparameter Purpose
max_features Number of features for best split

ランダムフォレストは多数の決定木からなるアンサンブルです。n_estimators はフォレスト内で使用する木の本数を制御し、max_features は各決定木で最良の分割を探す際にランダムフォレストが考慮する特徴量の数を制御します。

ランダムフォレスト分類器は clf としてすでに用意されています。

指示1 / 4

undefined XP
    1
    2
    3
    4
  • sklearn.model_selection から GridSearchCV をインポートします。