Rastgele orman modeli kur
Burada, her bölüm için rastgele ormanları kurmak (train kullanarak) ve değerlendirmek (validate kullanarak) için aynı çapraz doğrulama verilerini kullanacaksın. Regresyon modellerinle aynı çapraz doğrulama bölümlerini kullandığın için, iki modelin performansını doğrudan karşılaştırabilirsin.
Not: Uygun sürede eğitimi tamamlamak için rastgele ormanlarımızı 100 ağaçla sınırlayacağız. ranger() için varsayılan ağaç sayısı 500'dür.
Bu egzersiz
Tidyverse ile Machine Learning
kursunun bir parçasıdırEgzersiz talimatları
- Her çapraz doğrulama bölümü için
trainiçindeki tüm özellikleri kullanaraklife_expectancy'yi tahmin eden bir rastgele orman kurmak üzereranger()kullan. - Az önce oluşturduğun rastgele orman modellerini kullanarak
validateiçindeki gözlemler içinlife_expectancytahminini ekleyenvalidate_predictedadlı yeni bir sütun ekle.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
library(ranger)
# Build a random forest model for each fold
cv_models_rf <- cv_data %>%
mutate(model = map(___, ~ranger(formula = ___, data = ___,
num.trees = 100, seed = 42)))
# Generate predictions using the random forest model
cv_prep_rf <- cv_models_rf %>%
mutate(validate_predicted = map2(.x = ___, .y = ___, ~predict(.x, .y)$predictions))