Penyetelan sepanjang grid
Setelah membuat grid penyetelan dan spesifikasi dummy, Anda perlu melatih model pada setiap titik grid dan mengevaluasi model yang dihasilkan.
Ini sangat mudah dilakukan dalam kerangka kerja tidymodels menggunakan fungsi tune_grid(), seperti diperkenalkan di slide.
Pada latihan berikutnya, Anda akan menggunakan himpunan data pelanggan kartu kredit, yang memiliki kolom-kolom berikut:
still_customer: penanda (yes atau no) yang menunjukkan apakah seorang pelanggan masih aktiftotal_trans_amt: total jumlah transaksi dalam USDcustomer_age: usia pelangganincome_category: label seperti $60K - $80K atau Less than $40K untuk menunjukkan kategori pendapatan tahunan- … dan 16 kolom lainnya.
Silakan periksa tibble customers di konsol! Hasil dari latihan sebelumnya, tree_grid dan tune_spec, masih dimuat.
Latihan ini merupakan bagian dari kursus
Machine Learning dengan Model Berbasis Pohon di R
Instruksi latihan
- Buat tiga lipatan cross-validation dari himpunan data Anda dan simpan sebagai
folds. - Buat
tune_resultsdengan menyetel spesifikasi sepanjang grid menggunakan semua prediktor untuk memprediksistill_customer, lipatan CV Anda sebagai resamples, danmetric_set(accuracy). - Gunakan
autoplot()untuk membuat plot hasil penyetelan.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
set.seed(275)
# Create CV folds of the customers tibble
folds <- ___
# Tune along the grid
tune_results <- tune_grid(___,
___,
resamples = ___,
grid = ___,
metrics = ___)
# Plot the tuning results
___(tune_results)