特徴量数のチューニング

モデルで使われるデフォルトのハイパーパラメータは、皆さんのデータに最適化されていません。グリッドサーチ交差検証の目的は、モデル性能を最大化するハイパーパラメータを見つけることです。動画では、ランダムフォレストの n_estimators ハイパーパラメータのチューニング方法を見ました。ここでは、max_features ハイパーパラメータのチューニングを練習します。コードを素早く実行するため、cv ハイパーパラメータは 3 に設定されています。

Hyperparameter	Purpose
max_features	Number of features for best split

ランダムフォレストは多数の決定木からなるアンサンブルです。n_estimators はフォレスト内で使用する木の本数を制御し、max_features は各決定木で最良の分割を探す際にランダムフォレストが考慮する特徴量の数を制御します。

ランダムフォレスト分類器は clf としてすでに用意されています。

sklearn.model_selection から GridSearchCV をインポートします。

अभ्यास

特徴量数のチューニング

निर्देश 1/4

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}अभ्यास

निर्देश 1/4

अभ्यास