Der am besten performende Parameter
Du hast jetzt Modelle erstellt, bei denen du den random-forest-spezifischen Hyperparameter mtry variiert hast, um dein Modell weiter zu verbessern. Jetzt misst du die Performance jedes mtry-Werts über die 5 Cross-Validation-Partitionen, um zu sehen, ob du das Modell verbessern kannst.
Denk daran: Der validierte MAE, den du vor zwei Übungen berechnet hast, 0.795, war für den Standardwert von mtry 2.
Diese Übung ist Teil des Kurses
<Kurs>Machine Learning im Tidyverse</Kurs>Übungsanweisungen
- Erzeuge Vorhersagen für jede mtry/Fold-Kombination.
- Berechne den MAE für jede mtry/Fold-Kombination.
- Berechne den durchschnittlichen MAE für jeden Wert von
mtry.
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Generate validate predictions for each model
cv_prep_tunerf <- cv_model_tunerf %>%
mutate(validate_predicted = map2(.x = ___, .y = ___, ~predict(.x, .y)$predictions))
# Calculate validate MAE for each fold and mtry combination
cv_eval_tunerf <- cv_prep_tunerf %>%
mutate(validate_mae = map2_dbl(.x = ___, .y = ___, ~mae(actual = .x, predicted = .y)))
# Calculate the mean validate_mae for each mtry used
cv_eval_tunerf %>%
group_by(___) %>%
summarise(mean_mae = mean(___))