1. 学ぶ
  2. /
  3. コース
  4. /
  5. End-to-End Machine Learning

Connected

演習

特徴選択

モデリングの前処理では、モデルが予測(または診断)の根拠とするのに役立つ特徴量のセットを用意することが重要です。役に立つためには、特徴量が心疾患データセットの本質的な特性を互いに直交的な形で捉える必要があります。データは多ければよいというわけではありません!

sklearn.feature_selection.SelectFromModel モジュールを使うと、有用な特徴量を選択できます。SelectFromModel は、RandomForestClassifier モデルを用いて心疾患診断のタスクに最も重要な特徴量を見つける、総当たり型の方法を実装しています。

RandomForestClassifier はすでにインポート済みで、心疾患データの特徴量と目的変数はそれぞれ X_train と y_train として読み込まれています。

指示1 / 4

undefined XP
    1
    2
    3
    4
  • n_jobs = -1、class_weight は 'balanced'、max_depth = 5 のランダムフォレスト分類器を定義し、.fit() を使って heart_disease_df に対して特徴選択を行ってください。