Melatih random forest
Seperti yang Anda lihat dalam video, model random forest jauh lebih fleksibel daripada model linear, mampu memodelkan efek nonlinier yang kompleks serta secara otomatis menangkap interaksi antarvariabel. Model ini cenderung memberikan hasil yang sangat baik pada data dunia nyata, jadi mari kita coba pada himpunan data kualitas anggur, dengan tujuan memprediksi kualitas suatu batch anggur yang dinilai manusia, berdasarkan beberapa sifat kimia dan fisik yang diukur mesin dari batch tersebut.
Melatih model random forest persis sama seperti melatih model regresi linear terumumkan, seperti yang Anda lakukan di bab sebelumnya. Anda cukup mengubah argumen method dalam fungsi train menjadi "ranger". Paket ranger adalah penulisan ulang dari paket klasik R randomForest dan melatih model jauh lebih cepat, namun memberikan hasil yang hampir sama persis. Kami menyarankan semua pemula menggunakan paket ranger untuk pemodelan random forest.
Latihan ini adalah bagian dari kursus
Machine Learning dengan caret di R
Petunjuk latihan
- Latih sebuah random forest bernama
modelpada himpunan data kualitas anggur,wine, sehinggaqualitymenjadi variabel respons dan semua variabel lainnya menjadi variabel penjelas. - Gunakan
method = "ranger". - Gunakan
tuneLengthsebesar 1. - Gunakan 5 lipatan CV.
- Cetak
modelke konsol.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Fit random forest: model
model <- train(
___,
tuneLength = ___,
data = ___,
method = ___,
trControl = trainControl(
method = "cv",
number = ___,
verboseIter = TRUE
)
)
# Print model to console