1. 学ぶ
  2. /
  3. コース
  4. /
  5. Rで学ぶTree-Based ModelsによるMachine Learning

Connected

演習

学習データ内と学習データ外の性能

より高度なモデルは常に良い性能を出すのでしょうか? 動画でお話ししたように、それは半分だけ正しいです。

過学習したモデルは、学習用データの構造は完璧に捉えますが、新しいデータにはうまく汎化できません。 それは困りますよね! 結局のところ、予測モデルの主な目的は新しいデータで良い性能を出すことです。では、実際に確かめてみましょう!

前の演習で作成した最後のモデル complex_model と、学習用とテスト用のデータ(chocolate_train と chocolate_test)が読み込まれています。

指示1 / 2

undefined XP
  • 1
    • complex_model を使って学習データの評価を予測し、これらの予測値を元の学習データに追加して、平均絶対誤差を計算します。
  • 2
    • コードをテストデータの評価を予測するように調整し、予測値を元のテストデータに追加して、平均絶対誤差を計算します。