1. 学ぶ
  2. /
  3. コース
  4. /
  5. Tidyverse で学ぶ Machine Learning

Connected

演習

クロスバリデーション用データフレーム

すでにデータの一部をテストデータとして取り分けましたので、残りのデータで最も良いモデルを探していきます。

この演習では、rsample パッケージの vfold_cv() 関数を使い、学習データを 5 組の train-validate セットに分割します。

指示

100 XP
  • training_data から vfold_cv() を使って 5-fold クロスバリデーション用のデータフレームを作成し、cv_split に代入します。
  • cv_split に新しい 2 列を追加して cv_data を用意します:
    • train: splits 列に対して training() をマッピングして、学習用データフレームを格納します。
    • validate: splits 列に対して testing() をマッピングして、検証用データフレームを格納します。