Crea e valuta il modello migliore
Usando la cross-validation sei riuscito a identificare il modello migliore per prevedere life_expectancy usando tutte le variabili di gapminder. Ora che hai selezionato il tuo modello, puoi usare l’insieme di dati indipendente (testing_data) che hai tenuto da parte per stimare le prestazioni di questo modello su nuovi dati.
Costruirai questo modello usando tutti i training_data e lo valuterai usando i testing_data.
Questo esercizio fa parte del corso
Machine Learning nel tidyverse
Istruzioni dell'esercizio
- Usa
ranger()per costruire il modello con le prestazioni migliori (mtry = 4) utilizzando tutti i dati di training. Assegna il risultato abest_model. - Estrai la colonna
life_expectancydatesting_datae assegnala atest_actual. - Predici
life_expectancyusandobest_modelsui dati ditestinge assegna il risultato atest_predicted. - Calcola la MAE usando i vettori
test_actualetest_predicted.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Build the model using all training data and the best performing parameter
best_model <- ranger(formula = ___, data = ___,
mtry = ___, num.trees = 100, seed = 42)
# Prepare the test_actual vector
test_actual <- testing_data$___
# Predict life_expectancy for the testing_data
test_predicted <- predict(___, ___)$predictions
# Calculate the test MAE
mae(___, ___)