1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶMachine Learning面接対策

Connected

演習

特徴量重要度による特徴量選択

前の演習では、Machine Learning で特徴量を選択する際に、フィルタ法やラッパー法がどのように役立つかを練習しました。今回は、diabetes データフレームを使って、木ベースの Machine Learning アルゴリズムに組み込まれている特徴量重要度を用いた特徴量選択を実践します。

DataCamp では一部しか扱えませんが、scikit-learn の公式サイトには他の特徴量選択法について詳しいドキュメントがあります。

特徴量行列と目的変数配列は、それぞれ X と y としてワークスペースに保存されています。

特徴量選択は前処理ステップの一部であることを思い出してください。 Machine learning pipeline

指示1 / 2

undefined XP
  • 1
    • Random Forest 回帰モデルをインスタンス化するために、正しい関数をインポートします。
    • モデルを学習させ、特徴量重要度を出力します。
  • 2
    • Extra Tree 回帰モデルをインスタンス化するために、正しい関数をインポートします。
    • モデルを学習させ、特徴量重要度を出力します。