MulaiMulai sekarang secara gratis

Penyetelan yang sebenarnya

Hiperparameter terbaik menghasilkan model terbaik untuk data Anda. Setelah Anda menentukan grid penyetelan, Anda perlu melatih dan mengevaluasi model pada setiap titik grid untuk melihat titik grid mana yang memberikan kinerja model terbaik.

Ini dapat memakan waktu, mengingat dengan menggunakan validasi silang k-lipat, ukuran ensemble n pohon, dan grid penyetelan dengan t kombinasi menghasilkan total k * n * t model yang harus dilatih.

Sekarang giliran Anda melakukan penyetelan yang sebenarnya! Telah dimuat sebelumnya customers_train serta hasil dari latihan terakhir, boost_spec dan tunegrid_boost:

# A tibble: 27 x 3
   tree_depth    learn_rate  sample_size
        <int>         <dbl>        <dbl>
 1          1  0.0000000001         0.1 
 2          8  0.0000000001         0.1 
 3         15  0.0000000001         0.1 
 4          1  0.00000316           0.1 
 ...

Latihan ini adalah bagian dari kursus

Machine Learning dengan Model Berbasis Pohon di R

Lihat Kursus

Petunjuk latihan

  • Buat enam lipatan dari data pelatihan menggunakan vfold_cv() dan simpan sebagai folds.
  • Gunakan tune_grid() untuk menyetel boost_spec dengan lipatan Anda, grid penyetelan Anda, dan metrik roc_auc. Simpan hasilnya sebagai tune_results.
  • Visualisasikan hasilnya dengan membuat plot proses penyetelan.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Create CV folds of training data
folds <- ___

# Tune along the grid
tune_results <- ___(___,
                    still_customer ~ .,
                    resamples = ___,
                    grid = ___,
                    metrics = metric_set(___))

# Plot the results
___(___)
Edit dan Jalankan Kode