LoslegenKostenlos loslegen

Bestes Modell aufbauen & auswerten

Mit Cross-Validation konntest du das beste Modell zur Vorhersage von life_expectancy mit allen Features aus gapminder identifizieren. Jetzt, da du dein Modell ausgewählt hast, kannst du den unabhängigen Datensatz (testing_data), den du zurückgehalten hast, verwenden, um die Performance dieses Modells auf neuen Daten abzuschätzen.

Du wirst dieses Modell mit allen training_data aufbauen und mit testing_data auswerten.

Diese Übung ist Teil des Kurses

Machine Learning im Tidyverse

Kurs anzeigen

Anleitung zur Übung

  • Verwende ranger(), um das leistungsstärkste Modell (mtry = 4) mit allen Trainingsdaten zu erstellen. Weise es best_model zu.
  • Extrahiere die Spalte life_expectancy aus testing_data und weise sie test_actual zu.
  • Sage life_expectancy mithilfe von best_model auf den testing-Daten voraus und weise das Ergebnis test_predicted zu.
  • Berechne die MAE mit den Vektoren test_actual und test_predicted.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Build the model using all training data and the best performing parameter
best_model <- ranger(formula = ___, data = ___,
                     mtry = ___, num.trees = 100, seed = 42)

# Prepare the test_actual vector
test_actual <- testing_data$___

# Predict life_expectancy for the testing_data
test_predicted <- predict(___, ___)$predictions

# Calculate the test MAE
mae(___, ___)
Code bearbeiten und ausführen