1. 学ぶ
  2. /
  3. コース
  4. /
  5. Tidyverse で学ぶ Machine Learning

Connected

演習

学習・テスト・検証の準備

この演習では、これまでに学んだツールを活用して、従業員の離職を予測する分類モデルを構築します。

使用するデータは attrition で、従業員に関する30の特徴量が含まれています。これらを使って、従業員が会社を離れたかどうかを予測します。

まず学習用データとテスト用データを用意し、その後、交差検証を使って学習データをさらに分割し、このタスクで最も良い性能のモデルを探索できるようにします。

指示1 / 2

undefined XP
    1
    2
  • initial_split() 関数を使って、データを学習75%・テスト25%に分割します。
  • training() と testing() を使って、data_split からそれぞれ学習用とテスト用のデータフレームを取り出します。