Coba panjang penyetelan yang lebih besar
Ingat dari video bahwa model random forest memiliki parameter penyetelan utama mtry, yang mengatur berapa banyak variabel yang diekspos ke rutinitas pencarian pemisahan pada setiap split. Misalnya, anggap suatu pohon memiliki total 10 split dan mtry = 2. Ini berarti ada 10 sampel yang masing-masing berisi 2 prediktor setiap kali suatu split dievaluasi.
Gunakan kisi penyetelan yang lebih besar kali ini, tetapi tetap gunakan nilai baku yang disediakan oleh fungsi train(). Coba tuneLength bernilai 3, bukan 1, untuk mengeksplorasi beberapa model potensial tambahan, dan plot model yang dihasilkan menggunakan fungsi plot.
Latihan ini merupakan bagian dari kursus
Machine Learning dengan caret di R
Instruksi latihan
- Latih model random forest,
model, menggunakan himpunan datawinepada variabelqualitydengan semua variabel lainnya sebagai variabel penjelas. (Ini akan memerlukan beberapa detik untuk berjalan, jadi harap bersabar!) - Gunakan
method = "ranger". - Ubah
tuneLengthmenjadi 3. - Gunakan 5 lipatan CV.
- Cetak
modelke konsol. - Plot model setelah pelatihan.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Fit random forest: model
model <- train(
___,
tuneLength = 1,
data = ___,
method = ___,
trControl = trainControl(
method = "cv",
number = ___,
verboseIter = TRUE
)
)
# Print model to console
# Plot model