1. 学ぶ
  2. /
  3. コース
  4. /
  5. Rで学ぶ caret を使った Machine Learning

Connected

演習

カスタムの学習/テストインデックスを作る

動画で見たとおり、この章では前の章で扱った概念を総動員して、実世界のデータセットに取り組みます。

churn データセットには、さまざまな通信会社の顧客データが含まれており、どの顧客が解約(churn)するかを予測することが課題です。

この章では、glmnet と rf という2種類の予測モデルを比較します。まずは、それらを安定して比較できるよう、再利用可能な trainControl オブジェクトを作成しましょう。

指示

100 XP

churn_x と churn_y がワークスペースに読み込まれています。

  • createFolds() を使って、目的変数である churn_y に対して 5 分割の CV フォールドを作成します。
  • 作成したフォールドを trainControl() に渡し、モデル比較に使える再利用可能な trainControl を作成します。