Bestes Modell aufbauen & auswerten
Mit Cross-Validation konntest du das beste Modell zur Vorhersage von life_expectancy mit allen Features aus gapminder identifizieren. Jetzt, da du dein Modell ausgewählt hast, kannst du den unabhängigen Datensatz (testing_data), den du zurückgehalten hast, verwenden, um die Performance dieses Modells auf neuen Daten abzuschätzen.
Du wirst dieses Modell mit allen training_data aufbauen und mit testing_data auswerten.
Diese Übung ist Teil des Kurses
Machine Learning im Tidyverse
Anleitung zur Übung
- Verwende
ranger(), um das leistungsstärkste Modell (mtry = 4) mit allen Trainingsdaten zu erstellen. Weise esbest_modelzu. - Extrahiere die Spalte
life_expectancyaustesting_dataund weise sietest_actualzu. - Sage
life_expectancymithilfe vonbest_modelauf dentesting-Daten voraus und weise das Ergebnistest_predictedzu. - Berechne die MAE mit den Vektoren
test_actualundtest_predicted.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Build the model using all training data and the best performing parameter
best_model <- ranger(formula = ___, data = ___,
mtry = ___, num.trees = 100, seed = 42)
# Prepare the test_actual vector
test_actual <- testing_data$___
# Predict life_expectancy for the testing_data
test_predicted <- predict(___, ___)$predictions
# Calculate the test MAE
mae(___, ___)