Il parametro con prestazioni migliori

Hai appena costruito modelli variando l’hyperparameter specifico dei random forest, mtry, per cercare di migliorare ulteriormente il modello. Ora misurerai le prestazioni di ciascun valore di mtry sulle 5 partizioni di cross validation per vedere se puoi ottenere un miglioramento.

Ricorda che la MAE di validazione che hai calcolato due esercizi fa, pari a 0.795, corrispondeva al valore predefinito di mtry pari a 2.

Questo esercizio fa parte del corso

Machine Learning nel tidyverse

Visualizza corso

Istruzioni dell'esercizio

Genera le previsioni per ogni combinazione mtry/fold.
Calcola la MAE per ogni combinazione mtry/fold.
Calcola la MAE media per ciascun valore di mtry.

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

# Generate validate predictions for each model
cv_prep_tunerf <- cv_model_tunerf %>% 
  mutate(validate_predicted = map2(.x = ___, .y = ___, ~predict(.x, .y)$predictions))

# Calculate validate MAE for each fold and mtry combination
cv_eval_tunerf <- cv_prep_tunerf %>% 
  mutate(validate_mae = map2_dbl(.x = ___, .y = ___, ~mae(actual = .x, predicted = .y)))

# Calculate the mean validate_mae for each mtry used  
cv_eval_tunerf %>% 
  group_by(___) %>% 
  summarise(mean_mae = mean(___))

Modifica ed esegui il codice