Penyetelan yang sebenarnya
Hiperparameter terbaik menghasilkan model terbaik untuk data Anda. Setelah Anda menentukan grid penyetelan, Anda perlu melatih dan mengevaluasi model pada setiap titik grid untuk melihat titik grid mana yang memberikan kinerja model terbaik.
Ini dapat memakan waktu, mengingat dengan menggunakan validasi silang k-lipat, ukuran ensemble n pohon, dan grid penyetelan dengan t kombinasi menghasilkan total k * n * t model yang harus dilatih.
Sekarang giliran Anda melakukan penyetelan yang sebenarnya! Telah dimuat sebelumnya customers_train serta hasil dari latihan terakhir, boost_spec dan tunegrid_boost:
# A tibble: 27 x 3
tree_depth learn_rate sample_size
<int> <dbl> <dbl>
1 1 0.0000000001 0.1
2 8 0.0000000001 0.1
3 15 0.0000000001 0.1
4 1 0.00000316 0.1
...
Latihan ini adalah bagian dari kursus
Machine Learning dengan Model Berbasis Pohon di R
Petunjuk latihan
- Buat enam lipatan dari data pelatihan menggunakan
vfold_cv()dan simpan sebagaifolds. - Gunakan
tune_grid()untuk menyetelboost_specdengan lipatan Anda, grid penyetelan Anda, dan metrikroc_auc. Simpan hasilnya sebagaitune_results. - Visualisasikan hasilnya dengan membuat plot proses penyetelan.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Create CV folds of training data
folds <- ___
# Tune along the grid
tune_results <- ___(___,
still_customer ~ .,
resamples = ___,
grid = ___,
metrics = metric_set(___))
# Plot the results
___(___)