Il parametro con prestazioni migliori
Hai appena costruito modelli variando l’hyperparameter specifico dei random forest, mtry, per cercare di migliorare ulteriormente il modello. Ora misurerai le prestazioni di ciascun valore di mtry sulle 5 partizioni di cross validation per vedere se puoi ottenere un miglioramento.
Ricorda che la MAE di validazione che hai calcolato due esercizi fa, pari a 0.795, corrispondeva al valore predefinito di mtry pari a 2.
Questo esercizio fa parte del corso
Machine Learning nel tidyverse
Istruzioni dell'esercizio
- Genera le previsioni per ogni combinazione mtry/fold.
- Calcola la MAE per ogni combinazione mtry/fold.
- Calcola la MAE media per ciascun valore di
mtry.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Generate validate predictions for each model
cv_prep_tunerf <- cv_model_tunerf %>%
mutate(validate_predicted = map2(.x = ___, .y = ___, ~predict(.x, .y)$predictions))
# Calculate validate MAE for each fold and mtry combination
cv_eval_tunerf <- cv_prep_tunerf %>%
mutate(validate_mae = map2_dbl(.x = ___, .y = ___, ~mae(actual = .x, predicted = .y)))
# Calculate the mean validate_mae for each mtry used
cv_eval_tunerf %>%
group_by(___) %>%
summarise(mean_mae = mean(___))