1. 学习
  2. /
  3. 课程
  4. /
  5. Rで学ぶTree-Based ModelsによるMachine Learning

Connected

练习

実際のチューニング

最適なハイパーパラメータは、データに最適なモデルを生み出します。チューニンググリッドを決めたら、各グリッドポイントでモデルを学習・評価し、どのポイントが最も良い性能を出すかを確認する必要があります。

k-fold 交差検証を使い、アンサンブルの木の本数が n、チューニンググリッドの組み合わせ数が t の場合、合計で学習するモデル数は k * n * t となるため、時間がかかることがあります。

いよいよ実際のチューニングを行いましょう。customers_train と、前の演習の結果である boost_spec と tunegrid_boost が読み込まれています。

# A tibble: 27 x 3
   tree_depth    learn_rate  sample_size
        <int>         <dbl>        <dbl>
 1          1  0.0000000001         0.1 
 2          8  0.0000000001         0.1 
 3         15  0.0000000001         0.1 
 4          1  0.00000316           0.1 
 ...

说明

100 XP
  • vfold_cv() を使って学習データから 6 分割のフォールドを作成し、folds として保存します。
  • tune_grid() を使い、フォールド、チューニンググリッド、roc_auc 指標で boost_spec をチューニングします。結果は tune_results として保存します。
  • チューニング過程の結果を可視化するため、結果をプロットします。