Der am besten performende Parameter
Du hast jetzt Modelle erstellt, bei denen du den random-forest-spezifischen Hyperparameter mtry variiert hast, um dein Modell weiter zu verbessern. Jetzt misst du die Performance jedes mtry-Werts über die 5 Cross-Validation-Partitionen, um zu sehen, ob du das Modell verbessern kannst.
Denk daran: Der validierte MAE, den du vor zwei Übungen berechnet hast, 0.795, war für den Standardwert von mtry 2.
Diese Übung ist Teil des Kurses
Machine Learning im Tidyverse
Anleitung zur Übung
- Erzeuge Vorhersagen für jede mtry/Fold-Kombination.
- Berechne den MAE für jede mtry/Fold-Kombination.
- Berechne den durchschnittlichen MAE für jeden Wert von
mtry.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Generate validate predictions for each model
cv_prep_tunerf <- cv_model_tunerf %>%
mutate(validate_predicted = map2(.x = ___, .y = ___, ~predict(.x, .y)$predictions))
# Calculate validate MAE for each fold and mtry combination
cv_eval_tunerf <- cv_prep_tunerf %>%
mutate(validate_mae = map2_dbl(.x = ___, .y = ___, ~mae(actual = .x, predicted = .y)))
# Calculate the mean validate_mae for each mtry used
cv_eval_tunerf %>%
group_by(___) %>%
summarise(mean_mae = mean(___))