MulaiMulai sekarang secara gratis

Kinerja random forest

Sekarang saatnya melihat apakah model random forest yang Anda bangun pada latihan sebelumnya mampu mengungguli model regresi logistik.

Ingat bahwa nilai recall pada data validasi untuk model regresi logistik adalah 0,43.

Latihan ini adalah bagian dari kursus

Machine Learning di Tidyverse

Lihat Kursus

Petunjuk latihan

  • Siapkan kolom validate_actual dan validate_predicted untuk setiap kombinasi mtry/fold.
  • Hitung recall untuk setiap kombinasi mtry/fold.
  • Hitung rata-rata recall untuk setiap nilai mtry.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

cv_prep_rf <- cv_models_rf %>% 
  mutate(
    # Prepare binary vector of actual Attrition values in validate
    validate_actual = map(validate, ~.x$___ == "___"),
    # Prepare binary vector of predicted Attrition values for validate
    validate_predicted = map2(.x = ___, .y = ___, ~predict(.x, .y, type = "response")$predictions == "Yes")
  )

# Calculate the validate recall for each cross validation fold
cv_perf_recall <- cv_prep_rf %>% 
  mutate(recall = map2_dbl(.x = ___, .y = ___, ~recall(actual = .x, predicted = .y)))

# Calculate the mean recall for each mtry used  
cv_perf_recall %>% 
  group_by(___) %>% 
  summarise(mean_recall = mean(___))
Edit dan Jalankan Kode