1. Учиться
  2. /
  3. Courses
  4. /
  5. R による Supervised Learning:回帰

Connected

Exercise

クロスバリデーション計画を作成する

n 分割のクロスバリデーション計画を実装する方法はいくつかあります。この演習では、vtreat::kWayCrossValidation() を使ってそのような計画を作成し、内容を確認します。

kWayCrossValidation() は次の呼び出しでクロスバリデーション計画を作成します。

splitPlan <- kWayCrossValidation(nRows, nSplits, dframe, y)

ここで、nRows は分割するデータの行数、nSplits は望ましいクロスバリデーションの分割数(fold 数)です。

厳密には、dframe と y は kWayCrossValidation では使用されません。これは他の vtreat のデータ分割関数との互換性のためにあります。どちらも NULL に設定して構いません。

得られる splitPlan は nSplits 個の要素からなるリストで、各要素は次の 2 つのベクトルを含みます。

  • train: 訓練データセットを構成する dframe のインデックス
  • app: テスト(またはアプリケーション)データセットを構成する dframe のインデックス

この演習では、データセット mpg に対して 3 分割のクロスバリデーション計画を作成します。

Инструкции

100 XP
  • パッケージ vtreat を読み込みます。
  • mpg の行数を取得して、変数 nRows に代入します。
  • kWayCrossValidation を呼び出して 3 分割のクロスバリデーション計画を作成し、変数 splitPlan に代入します。
    • 関数の最後の 2 つの引数は NULL に設定して構いません。
  • str() を呼び出して、splitPlan の構造を確認します。