Aan de slagGa gratis aan de slag

Bouw en evalueer het beste model

Met cross-validatie heb je het beste model gevonden om life_expectancy te voorspellen met alle features in gapminder. Nu je je model hebt gekozen, kun je de onafhankelijke gegevensset (testing_data) die je apart hield gebruiken om de prestatie van dit model op nieuwe data te schatten.

Je bouwt dit model met alle training_data en evalueert met testing_data.

Deze oefening maakt deel uit van de cursus

Machine Learning in de tidyverse

Cursus bekijken

Oefeninstructies

  • Gebruik ranger() om het best presterende model (mtry = 4) te bouwen met alle trainingsdata. Ken dit toe aan best_model.
  • Haal de kolom life_expectancy uit testing_data en ken die toe aan test_actual.
  • Voorspel life_expectancy met best_model op de testing-data en ken dit toe aan test_predicted.
  • Bereken de MAE met de vectors test_actual en test_predicted.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Build the model using all training data and the best performing parameter
best_model <- ranger(formula = ___, data = ___,
                     mtry = ___, num.trees = 100, seed = 42)

# Prepare the test_actual vector
test_actual <- testing_data$___

# Predict life_expectancy for the testing_data
test_predicted <- predict(___, ___)$predictions

# Calculate the test MAE
mae(___, ___)
Code bewerken en uitvoeren