Rastgele orman modeli kur
Videoda gördüğün gibi, rastgele orman modelleri doğrusal modellere göre çok daha esnektir; karmaşık doğrusal olmayan etkileri modelleyebilir ve değişkenler arası etkileşimleri otomatik olarak yakalayabilir. Gerçek dünya verilerinde genellikle çok iyi sonuç verirler, o yüzden gel bunu şarap kalitesi veri kümesi üzerinde deneyelim. Amacımız, bir parti şarabın bazı makine ölçümü kimyasal ve fiziksel özelliklerine bakarak, insan değerlendirmesine dayalı kalitesini tahmin etmektir.
Rastgele orman modeli kurmak, bir önceki bölümde yaptığın genelleştirilmiş doğrusal regresyon modelini kurmakla tamamen aynıdır. Sadece train fonksiyonundaki method argümanını "ranger" olarak değiştirirsin. ranger paketi, R'ın klasik randomForest paketinin yeniden yazımıdır; modelleri çok daha hızlı kurar ama neredeyse aynı sonuçları verir. Rastgele orman modellemesi için tüm başlangıç seviyesindeki kullanıcılara ranger paketini öneriyoruz.
Bu egzersiz
R ile caret kullanarak Machine Learning
kursunun bir parçasıdırEgzersiz talimatları
wineşarap kalitesi veri kümesi üzerinde, yanıt değişkeniqualityve diğer tüm değişkenler açıklayıcı olacak şekildemodeladlı bir rastgele orman modeli eğit.method = "ranger"kullan.tuneLengthdeğerini 1 yap.- 5 katlı CV kullan.
modeldeğişkenini konsola yazdır.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Fit random forest: model
model <- train(
___,
tuneLength = ___,
data = ___,
method = ___,
trControl = trainControl(
method = "cv",
number = ___,
verboseIter = TRUE
)
)
# Print model to console