1. Uczyć się
  2. /
  3. Courses
  4. /
  5. R による Supervised Learning:回帰

Connected

Exercise

相互作用を用いたモデリング (2)

この演習では、前の演習で当てはめた相互作用ありのモデルと、主効果のみのモデルの性能を比較します。このデータセットは小さいため、クロスバリデーションで外部データへの予測を模擬します。

計算には dplyr パッケージを使い始めます。

  • mutate()(ドキュメント)は、tbl(データフレームの一種)に新しい列を追加します。
  • group_by()(ドキュメント)は、tbl 内で行のグループ化方法を指定します。
  • summarize()(ドキュメント)は、列の要約統計量を計算します。

また、tidyr の pivot_longer()(ドキュメント)も使います。これは複数の列をキーと値のペアに折りたたみます。alcohol データフレームと、数式 fmla_add および fmla_interaction はあらかじめ読み込まれています。

Instrukcje

100 XP
  • kWayCrossValidation()(ドキュメント)を使って、3分割のクロスバリデーション用の分割計画を作成します。
    • 第1引数は分割する行数です。
    • 第2引数はクロスバリデーションの分割数です。
    • 第3引数と第4引数は NULL に設定できます。
  • サンプルコードを確認して実行し、相互作用なしのモデルの3分割クロスバリデーション予測を取得して、列 pred_add に代入します。
  • 相互作用ありのモデルの3分割クロスバリデーション予測を取得します。予測は列 pred_interaction に代入します。
    • 手順はサンプルコードで示しています。
    • すでに作成した同じ splitPlan を使ってください。
  • 空欄を埋めて、次を行ってください。
    • 予測を1つの列 pred に pivot_longer でまとめます。
    • 残差(実測値 − 予測値)の列を追加します。
    • 各モデルタイプのクロスバリデーション予測のRMSEを求めます。
  • RMSEを比較しましょう。これらの結果に基づくと、どちらのモデルを使うべきでしょうか?