BaşlayınÜcretsiz Başlayın

Rastgele orman modeli kur

Burada, her bölüm için rastgele ormanları kurmak (train kullanarak) ve değerlendirmek (validate kullanarak) için aynı çapraz doğrulama verilerini kullanacaksın. Regresyon modellerinle aynı çapraz doğrulama bölümlerini kullandığın için, iki modelin performansını doğrudan karşılaştırabilirsin.

Not: Uygun sürede eğitimi tamamlamak için rastgele ormanlarımızı 100 ağaçla sınırlayacağız. ranger() için varsayılan ağaç sayısı 500'dür.

Bu egzersiz

Tidyverse ile Machine Learning

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • Her çapraz doğrulama bölümü için train içindeki tüm özellikleri kullanarak life_expectancy'yi tahmin eden bir rastgele orman kurmak üzere ranger() kullan.
  • Az önce oluşturduğun rastgele orman modellerini kullanarak validate içindeki gözlemler için life_expectancy tahminini ekleyen validate_predicted adlı yeni bir sütun ekle.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

library(ranger)

# Build a random forest model for each fold
cv_models_rf <- cv_data %>% 
  mutate(model = map(___, ~ranger(formula = ___, data = ___,
                                    num.trees = 100, seed = 42)))

# Generate predictions using the random forest model
cv_prep_rf <- cv_models_rf %>% 
  mutate(validate_predicted = map2(.x = ___, .y = ___, ~predict(.x, .y)$predictions))
Kodu Düzenle ve Çalıştır