Calcola le prestazioni con cross-validation
È fondamentale ottimizzare i modelli scegliendo con cura una metrica allineata all’obiettivo del modello.
Immagina di voler usare questo modello per identificare i dipendenti che potrebbero lasciare l’azienda. Idealmente, vuoi un modello che riesca a intercettare quanti più dipendenti in procinto di andarsene, così da poter intervenire. La metrica corrispondente che misura questo aspetto è il recall. Per questo motivo userai esclusivamente il recall per ottimizzare e selezionare i tuoi modelli.
Questo esercizio fa parte del corso
Machine Learning nel tidyverse
Istruzioni dell'esercizio
- Calcola il recall confrontando le risposte reali con quelle previste per ciascuna fold e assegnalo alla colonna
validate_recall. - Stampa la colonna
validate_recall. - Stampa la media di questa colonna.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Calculate the validate recall for each cross validation fold
cv_perf_recall <- cv_prep_lr %>%
mutate(validate_recall = map2_dbl(___, ___,
~recall(actual = .x, predicted = .y)))
# Print the validate_recall column
cv_perf_recall$___
# Calculate the average of the validate_recall column
___