1. 학습
  2. /
  3. 강의
  4. /
  5. Pythonで学ぶ次元削減

Connected

연습 문제

ランダムフォレストモデルを構築する

今回も Pima Indians データセットを用いて、各個人が糖尿病かどうかを予測します。今度はランダムフォレスト分類器を使います。train-test 分割を行ったあと、学習データでモデルを学習し、特徴量重要度を確認します。

特徴量データセットとターゲットデータセットは、それぞれ X と y としてあらかじめ読み込まれています。必要なパッケージや関数も同様に用意済みです。

지침

100 XP
  • テストサイズを 25% に設定して、75%-25% の train-test 分割を行ってください。
  • ランダムフォレスト分類器を学習データに適合させてください。
  • テストセットでの精度を計算してください。
  • 各特徴量ごとの重要度を出力してください。