1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶMachine Learning面接対策

Connected

演習

意思決定木の森

この演習では、ブートストラップされた Decision Tree、つまり Random Forest を使ってみます。前の演習と同様に、クロスバリデーションでハイパーパラメータをチューニングしたモデルと精度を比較します。

今回は追加で max_features というハイパーパラメータもチューニングします。これは、モデルが使用する特徴量の数を制御するものです。特に指定しない場合は auto がデフォルトになります。面接で覚えておきたいポイントとして、Decision Tree はデフォルトですべての特徴量を考慮しますが、Random Forest は通常、特徴量数の平方根を考慮します。

特徴量行列 X、目的変数 y、および sklearn.model_selection の train_test_split はインポート済みです。

指示1 / 2

undefined XP
  • 1
    • Random Forest 分類器の正しい関数をインポートし、データを学習用とテスト用に分割します。
    • Random Forest 分類器をインスタンス化し、学習、予測を行い、精度を出力します。
  • 2
    • クロスバリデーション付きグリッドサーチを行うための正しい関数をインポートします。
    • 今回はクロスバリデーション付きグリッドサーチを実行しながら、同じ手順を行います。