BaşlayınÜcretsiz başlayın

Rastgele orman modeli kur

Burada, her bölüm için rastgele ormanları kurmak (train kullanarak) ve değerlendirmek (validate kullanarak) için aynı çapraz doğrulama verilerini kullanacaksın. Regresyon modellerinle aynı çapraz doğrulama bölümlerini kullandığın için, iki modelin performansını doğrudan karşılaştırabilirsin.

Not: Uygun sürede eğitimi tamamlamak için rastgele ormanlarımızı 100 ağaçla sınırlayacağız. ranger() için varsayılan ağaç sayısı 500'dür.

Bu egzersiz, kursun bir parçasıdır

Tidyverse ile Machine Learning

Kursa Göz Atın

Egzersiz talimatları

  • Her çapraz doğrulama bölümü için train içindeki tüm özellikleri kullanarak life_expectancy'yi tahmin eden bir rastgele orman kurmak üzere ranger() kullan.
  • Az önce oluşturduğun rastgele orman modellerini kullanarak validate içindeki gözlemler için life_expectancy tahminini ekleyen validate_predicted adlı yeni bir sütun ekle.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

library(ranger)

# Build a random forest model for each fold
cv_models_rf <- cv_data %>% 
  mutate(model = map(___, ~ranger(formula = ___, data = ___,
                                    num.trees = 100, seed = 42)))

# Generate predictions using the random forest model
cv_prep_rf <- cv_models_rf %>% 
  mutate(validate_predicted = map2(.x = ___, .y = ___, ~predict(.x, .y)$predictions))
Kodu Düzenle ve Çalıştır