ComenzarEmpieza gratis

Construye y evalúa el mejor modelo

Gracias a la validación cruzada pudiste identificar el mejor modelo para predecir life_expectancy usando todas las variables de gapminder. Ahora que has seleccionado tu modelo, puedes usar el conjunto de datos independiente (testing_data) que reservaste para estimar el rendimiento de este modelo en datos nuevos.

Vas a construir este modelo con todos los training_data y evaluarlo con testing_data.

Este ejercicio forma parte del curso

Machine Learning en el tidyverse

Ver curso

Instrucciones del ejercicio

  • Usa ranger() para construir el modelo con mejor rendimiento (mtry = 4) utilizando todos los datos de entrenamiento. Asigna esto a best_model.
  • Extrae la columna life_expectancy de testing_data y asígnala a test_actual.
  • Predice life_expectancy usando best_model sobre los datos de testing y asígnalo a test_predicted.
  • Calcula el MAE usando los vectores test_actual y test_predicted.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Build the model using all training data and the best performing parameter
best_model <- ranger(formula = ___, data = ___,
                     mtry = ___, num.trees = 100, seed = 42)

# Prepare the test_actual vector
test_actual <- testing_data$___

# Predict life_expectancy for the testing_data
test_predicted <- predict(___, ___)$predictions

# Calculate the test MAE
mae(___, ___)
Editar y ejecutar código