Der am besten performende Parameter

Du hast jetzt Modelle erstellt, bei denen du den random-forest-spezifischen Hyperparameter mtry variiert hast, um dein Modell weiter zu verbessern. Jetzt misst du die Performance jedes mtry-Werts über die 5 Cross-Validation-Partitionen, um zu sehen, ob du das Modell verbessern kannst.

Denk daran: Der validierte MAE, den du vor zwei Übungen berechnet hast, 0.795, war für den Standardwert von mtry 2.

Diese Übung ist Teil des Kurses

Machine Learning im Tidyverse

Kurs anzeigen

Anleitung zur Übung

Erzeuge Vorhersagen für jede mtry/Fold-Kombination.
Berechne den MAE für jede mtry/Fold-Kombination.
Berechne den durchschnittlichen MAE für jeden Wert von mtry.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Generate validate predictions for each model
cv_prep_tunerf <- cv_model_tunerf %>% 
  mutate(validate_predicted = map2(.x = ___, .y = ___, ~predict(.x, .y)$predictions))

# Calculate validate MAE for each fold and mtry combination
cv_eval_tunerf <- cv_prep_tunerf %>% 
  mutate(validate_mae = map2_dbl(.x = ___, .y = ___, ~mae(actual = .x, predicted = .y)))

# Calculate the mean validate_mae for each mtry used  
cv_eval_tunerf %>% 
  group_by(___) %>% 
  summarise(mean_mae = mean(___))

Code bearbeiten und ausführen