意思決定木の森

この演習では、ブートストラップされた Decision Tree、つまり Random Forest を使ってみます。前の演習と同様に、クロスバリデーションでハイパーパラメータをチューニングしたモデルと精度を比較します。

今回は追加で max_features というハイパーパラメータもチューニングします。これは、モデルが使用する特徴量の数を制御するものです。特に指定しない場合は auto がデフォルトになります。面接で覚えておきたいポイントとして、Decision Tree はデフォルトですべての特徴量を考慮しますが、Random Forest は通常、特徴量数の平方根を考慮します。

特徴量行列 X、目的変数 y、および sklearn.model_selection の train_test_split はインポート済みです。