特徴量重要度による特徴量選択

前の演習では、Machine Learning で特徴量を選択する際に、フィルタ法やラッパー法がどのように役立つかを練習しました。今回は、diabetes データフレームを使って、木ベースの Machine Learning アルゴリズムに組み込まれている特徴量重要度を用いた特徴量選択を実践します。

DataCamp では一部しか扱えませんが、scikit-learn の公式サイトには他の特徴量選択法について詳しいドキュメントがあります。

特徴量行列と目的変数配列は、それぞれ X と y としてワークスペースに保存されています。