Kinerja random forest
Sekarang saatnya melihat apakah model random forest yang Anda bangun pada latihan sebelumnya mampu mengungguli model regresi logistik.
Ingat bahwa nilai recall pada data validasi untuk model regresi logistik adalah 0,43.
Latihan ini adalah bagian dari kursus
Machine Learning di Tidyverse
Petunjuk latihan
- Siapkan kolom
validate_actualdanvalidate_predicteduntuk setiap kombinasi mtry/fold. - Hitung recall untuk setiap kombinasi mtry/fold.
- Hitung rata-rata recall untuk setiap nilai
mtry.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
cv_prep_rf <- cv_models_rf %>%
mutate(
# Prepare binary vector of actual Attrition values in validate
validate_actual = map(validate, ~.x$___ == "___"),
# Prepare binary vector of predicted Attrition values for validate
validate_predicted = map2(.x = ___, .y = ___, ~predict(.x, .y, type = "response")$predictions == "Yes")
)
# Calculate the validate recall for each cross validation fold
cv_perf_recall <- cv_prep_rf %>%
mutate(recall = map2_dbl(.x = ___, .y = ___, ~recall(actual = .x, predicted = .y)))
# Calculate the mean recall for each mtry used
cv_perf_recall %>%
group_by(___) %>%
summarise(mean_recall = mean(___))