BaşlayınÜcretsiz Başlayın

Random forest performansı

Şimdi, önceki egzersizde oluşturduğun random forest modellerinin lojistik regresyon modelinden daha iyi performans gösterip göstermediğini görme zamanı.

Lojistik regresyon modelinin doğrulama recall değerinin 0.43 olduğunu unutma.

Bu egzersiz

Tidyverse ile Machine Learning

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • Her mtry/kat kombinasyonu için validate_actual ve validate_predicted sütunlarını hazırla.
  • Her mtry/kat kombinasyonu için recall hesapla.
  • Her mtry değeri için ortalama recall hesapla.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

cv_prep_rf <- cv_models_rf %>% 
  mutate(
    # Prepare binary vector of actual Attrition values in validate
    validate_actual = map(validate, ~.x$___ == "___"),
    # Prepare binary vector of predicted Attrition values for validate
    validate_predicted = map2(.x = ___, .y = ___, ~predict(.x, .y, type = "response")$predictions == "Yes")
  )

# Calculate the validate recall for each cross validation fold
cv_perf_recall <- cv_prep_rf %>% 
  mutate(recall = map2_dbl(.x = ___, .y = ___, ~recall(actual = .x, predicted = .y)))

# Calculate the mean recall for each mtry used  
cv_perf_recall %>% 
  group_by(___) %>% 
  summarise(mean_recall = mean(___))
Kodu Düzenle ve Çalıştır