Random forest performansı
Şimdi, önceki egzersizde oluşturduğun random forest modellerinin lojistik regresyon modelinden daha iyi performans gösterip göstermediğini görme zamanı.
Lojistik regresyon modelinin doğrulama recall değerinin 0.43 olduğunu unutma.
Bu egzersiz
Tidyverse ile Machine Learning
kursunun bir parçasıdırEgzersiz talimatları
- Her mtry/kat kombinasyonu için
validate_actualvevalidate_predictedsütunlarını hazırla. - Her mtry/kat kombinasyonu için recall hesapla.
- Her
mtrydeğeri için ortalama recall hesapla.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
cv_prep_rf <- cv_models_rf %>%
mutate(
# Prepare binary vector of actual Attrition values in validate
validate_actual = map(validate, ~.x$___ == "___"),
# Prepare binary vector of predicted Attrition values for validate
validate_predicted = map2(.x = ___, .y = ___, ~predict(.x, .y, type = "response")$predictions == "Yes")
)
# Calculate the validate recall for each cross validation fold
cv_perf_recall <- cv_prep_rf %>%
mutate(recall = map2_dbl(.x = ___, .y = ___, ~recall(actual = .x, predicted = .y)))
# Calculate the mean recall for each mtry used
cv_perf_recall %>%
group_by(___) %>%
summarise(mean_recall = mean(___))