Melatih random forest

Seperti yang Anda lihat dalam video, model random forest jauh lebih fleksibel daripada model linear, mampu memodelkan efek nonlinier yang kompleks serta secara otomatis menangkap interaksi antarvariabel. Model ini cenderung memberikan hasil yang sangat baik pada data dunia nyata, jadi mari kita coba pada himpunan data kualitas anggur, dengan tujuan memprediksi kualitas suatu batch anggur yang dinilai manusia, berdasarkan beberapa sifat kimia dan fisik yang diukur mesin dari batch tersebut.

Melatih model random forest persis sama seperti melatih model regresi linear terumumkan, seperti yang Anda lakukan di bab sebelumnya. Anda cukup mengubah argumen method dalam fungsi train menjadi "ranger". Paket ranger adalah penulisan ulang dari paket klasik R randomForest dan melatih model jauh lebih cepat, namun memberikan hasil yang hampir sama persis. Kami menyarankan semua pemula menggunakan paket ranger untuk pemodelan random forest.

Latihan ini merupakan bagian dari kursus

Machine Learning dengan caret di R

Lihat Kursus

Instruksi latihan

Latih sebuah random forest bernama model pada himpunan data kualitas anggur, wine, sehingga quality menjadi variabel respons dan semua variabel lainnya menjadi variabel penjelas.
Gunakan method = "ranger".
Gunakan tuneLength sebesar 1.
Gunakan 5 lipatan CV.
Cetak model ke konsol.

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

# Fit random forest: model
model <- train(
  ___,
  tuneLength = ___,
  data = ___, 
  method = ___,
  trControl = trainControl(
    method = "cv", 
    number = ___, 
    verboseIter = TRUE
  )
)

# Print model to console

Edit dan Jalankan Kode