Coba panjang penyetelan yang lebih besar
Ingat dari video bahwa model random forest memiliki parameter penyetelan utama mtry, yang mengatur berapa banyak variabel yang diekspos ke rutinitas pencarian pemisahan pada setiap split. Misalnya, anggap suatu pohon memiliki total 10 split dan mtry = 2. Ini berarti ada 10 sampel yang masing-masing berisi 2 prediktor setiap kali suatu split dievaluasi.
Gunakan kisi penyetelan yang lebih besar kali ini, tetapi tetap gunakan nilai baku yang disediakan oleh fungsi train(). Coba tuneLength bernilai 3, bukan 1, untuk mengeksplorasi beberapa model potensial tambahan, dan plot model yang dihasilkan menggunakan fungsi plot.
Latihan ini adalah bagian dari kursus
Machine Learning dengan caret di R
Petunjuk latihan
- Latih model random forest,
model, menggunakan himpunan datawinepada variabelqualitydengan semua variabel lainnya sebagai variabel penjelas. (Ini akan memerlukan beberapa detik untuk berjalan, jadi harap bersabar!) - Gunakan
method = "ranger". - Ubah
tuneLengthmenjadi 3. - Gunakan 5 lipatan CV.
- Cetak
modelke konsol. - Plot model setelah pelatihan.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Fit random forest: model
model <- train(
___,
tuneLength = 1,
data = ___,
method = ___,
trControl = trainControl(
method = "cv",
number = ___,
verboseIter = TRUE
)
)
# Print model to console
# Plot model