1. 学ぶ
  2. /
  3. コース
  4. /
  5. Rによる次元削減

Connected

演習

学習用データとテスト用データに分割する

モデルを学習する最初のステップは、データを学習用とテスト用に分割することです。tidymodels パッケージを使うと、これが簡単に行えます。テスト用データを取り分けておくことで、学習済みモデルを未見のデータで評価できます。

ここでは、医療系企業の従業員データと退職有無を含む従業員離職データを使います。データは attrition_df として利用可能です。目的変数は Attrition です。

tidyverse と tidymodels パッケージは読み込まれています。

指示

100 XP
  • データの分割を初期化し、学習用を80%に設定し、目的変数である Attrition に基づいて層化します。
  • 学習用データを抽出して train に保存します。
  • テスト用データを抽出して test に保存します。