1. เรียนรู้
  2. /
  3. Courses
  4. /
  5. Pythonで学ぶアンサンブル手法

Connected

Exercises

アプリの評価を予測する

前の演習で Google アプリのデータセットを確認しました。ここでは、その特徴量の一部からアプリの評価を予測するモデルを作成します。

そのために、scikit-learn の DecisionTreeRegressor を使います。決定木は多くのアンサンブルモデルの基本構成要素です。この仕組みを復習しておくと、コース全体で必ず役に立ちます。

評価指標には MAE(平均絶対誤差)を使います。これは、実際の評価と予測された評価の絶対差の平均を表すため、とても解釈しやすい指標です。

必要なモジュールはすべてインポート済みです。特徴量と目的変数は、それぞれ変数 X と y に用意されています。

คำแนะนำ

100 XP
  • train_test_split() を使って、X と y を学習用とテスト用に分割します。テストサイズは 20%(0.2)にしてください。
  • 次のハイパーパラメータを指定して DecisionTreeRegressor() をインスタンス化し、reg_dt として作成します: min_samples_leaf = 3 および min_samples_split = 9。
  • .fit() を使って学習データに回帰器を学習させます。
  • .predict() を使ってテストセットのラベルを予測します。