IniziaInizia gratis

Crea e valuta il modello migliore

Usando la cross-validation sei riuscito a identificare il modello migliore per prevedere life_expectancy usando tutte le variabili di gapminder. Ora che hai selezionato il tuo modello, puoi usare l’insieme di dati indipendente (testing_data) che hai tenuto da parte per stimare le prestazioni di questo modello su nuovi dati.

Costruirai questo modello usando tutti i training_data e lo valuterai usando i testing_data.

Questo esercizio fa parte del corso

Machine Learning nel tidyverse

Visualizza il corso

Istruzioni dell'esercizio

  • Usa ranger() per costruire il modello con le prestazioni migliori (mtry = 4) utilizzando tutti i dati di training. Assegna il risultato a best_model.
  • Estrai la colonna life_expectancy da testing_data e assegnala a test_actual.
  • Predici life_expectancy usando best_model sui dati di testing e assegna il risultato a test_predicted.
  • Calcola la MAE usando i vettori test_actual e test_predicted.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Build the model using all training data and the best performing parameter
best_model <- ranger(formula = ___, data = ___,
                     mtry = ___, num.trees = 100, seed = 42)

# Prepare the test_actual vector
test_actual <- testing_data$___

# Predict life_expectancy for the testing_data
test_predicted <- predict(___, ___)$predictions

# Calculate the test MAE
mae(___, ___)
Modifica ed esegui il codice