IniziaInizia gratis

Prestazioni della random forest

È il momento di verificare se i modelli di random forest che hai costruito nell’esercizio precedente riescono a superare il modello di regressione logistica.

Ricorda che il recall su validate per il modello di regressione logistica era 0,43.

Questo esercizio fa parte del corso

Machine Learning nel tidyverse

Visualizza il corso

Istruzioni dell'esercizio

  • Prepara le colonne validate_actual e validate_predicted per ogni combinazione mtry/fold.
  • Calcola il recall per ogni combinazione mtry/fold.
  • Calcola il recall medio per ciascun valore di mtry.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

cv_prep_rf <- cv_models_rf %>% 
  mutate(
    # Prepare binary vector of actual Attrition values in validate
    validate_actual = map(validate, ~.x$___ == "___"),
    # Prepare binary vector of predicted Attrition values for validate
    validate_predicted = map2(.x = ___, .y = ___, ~predict(.x, .y, type = "response")$predictions == "Yes")
  )

# Calculate the validate recall for each cross validation fold
cv_perf_recall <- cv_prep_rf %>% 
  mutate(recall = map2_dbl(.x = ___, .y = ___, ~recall(actual = .x, predicted = .y)))

# Calculate the mean recall for each mtry used  
cv_perf_recall %>% 
  group_by(___) %>% 
  summarise(mean_recall = mean(___))
Modifica ed esegui il codice