Penyetelan sepanjang grid
Setelah membuat grid penyetelan dan spesifikasi dummy, Anda perlu melatih model pada setiap titik grid dan mengevaluasi model yang dihasilkan.
Ini sangat mudah dilakukan dalam kerangka kerja tidymodels menggunakan fungsi tune_grid(), seperti diperkenalkan di slide.
Pada latihan berikutnya, Anda akan menggunakan himpunan data pelanggan kartu kredit, yang memiliki kolom-kolom berikut:
still_customer: penanda (yes atau no) yang menunjukkan apakah seorang pelanggan masih aktiftotal_trans_amt: total jumlah transaksi dalam USDcustomer_age: usia pelangganincome_category: label seperti $60K - $80K atau Less than $40K untuk menunjukkan kategori pendapatan tahunan- … dan 16 kolom lainnya.
Silakan periksa tibble customers di konsol! Hasil dari latihan sebelumnya, tree_grid dan tune_spec, masih dimuat.
Latihan ini adalah bagian dari kursus
Machine Learning dengan Model Berbasis Pohon di R
Petunjuk latihan
- Buat tiga lipatan cross-validation dari himpunan data Anda dan simpan sebagai
folds. - Buat
tune_resultsdengan menyetel spesifikasi sepanjang grid menggunakan semua prediktor untuk memprediksistill_customer, lipatan CV Anda sebagai resamples, danmetric_set(accuracy). - Gunakan
autoplot()untuk membuat plot hasil penyetelan.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
set.seed(275)
# Create CV folds of the customers tibble
folds <- ___
# Tune along the grid
tune_results <- tune_grid(___,
___,
resamples = ___,
grid = ___,
metrics = ___)
# Plot the tuning results
___(tune_results)