1. सीखें
  2. /
  3. पाठ्यक्रम
  4. /
  5. R による Supervised Learning:回帰

Connected

अभ्यास

入力の変換: "ホッケースティック"(2)

前の演習では、二次モデルのほうが線形モデルよりも houseprice データによく当てはまりそうだと分かりました。 この演習では、その二次モデルがアウトオブサンプルデータでもより良く機能するかを確認します。 このデータセットは小さいため、クロスバリデーションを用います。前の演習で作成した二次の式 fmla_sqr と、データフレーム houseprice は利用可能です。

比較のために、サンプルコードでは線形モデル price ~ size からクロスバリデーション予測を計算します。

निर्देश

100 XP
  • kWayCrossValidation() を使って、3-fold クロスバリデーションの分割計画を作成します。
    • この関数の第3・第4引数は NULL に設定できます。
  • サンプルコードを確認して実行し、モデル price ~ size の 3-fold クロスバリデーション予測を取得し、列 pred_lin に追加します。
  • 面積の二乗を説明変数とする価格のクロスバリデーション予測を取得し、列 pred_sqr に代入します。
    • 手順はサンプルコードに示されています。
    • すでに作成した分割計画を使えます。
  • 予測を縦持ちに変換して残差を計算する空欄を埋めてください。
  • 2つのモデルの RMSE を比較するための空欄を埋めてください。どちらがより適合していますか?