Construye y evalúa el mejor modelo
Gracias a la validación cruzada pudiste identificar el mejor modelo para predecir life_expectancy usando todas las variables de gapminder. Ahora que has seleccionado tu modelo, puedes usar el conjunto de datos independiente (testing_data) que reservaste para estimar el rendimiento de este modelo en datos nuevos.
Vas a construir este modelo con todos los training_data y evaluarlo con testing_data.
Este ejercicio forma parte del curso
Machine Learning en el tidyverse
Instrucciones del ejercicio
- Usa
ranger()para construir el modelo con mejor rendimiento (mtry = 4) utilizando todos los datos de entrenamiento. Asigna esto abest_model. - Extrae la columna
life_expectancydetesting_datay asígnala atest_actual. - Predice
life_expectancyusandobest_modelsobre los datos detestingy asígnalo atest_predicted. - Calcula el MAE usando los vectores
test_actualytest_predicted.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Build the model using all training data and the best performing parameter
best_model <- ranger(formula = ___, data = ___,
mtry = ___, num.trees = 100, seed = 42)
# Prepare the test_actual vector
test_actual <- testing_data$___
# Predict life_expectancy for the testing_data
test_predicted <- predict(___, ___)$predictions
# Calculate the test MAE
mae(___, ___)