Mejora tus modelos
Antes creaste una colección de modelos simples para ajustar la esperanza de vida usando la característica year. Tu análisis anterior mostró que algunos de esos modelos no ajustaban muy bien.
En este ejercicio, vas a construir modelos de regresión múltiple para cada país utilizando todas las características disponibles. Puede que te interese comparar el rendimiento de los cuatro modelos con peor ajuste; a continuación se muestran sus \(R^2\) ajustados:
| Country | Adjusted \(R^2\) |
|---|---|
| Botswana | -0.0060772 |
| Lesotho | -0.0169851 |
| Zambia | 0.1668999 |
| Zimbabwe | 0.2083979 |
Este ejercicio forma parte del curso
Machine Learning en el tidyverse
Instrucciones del ejercicio
- Crea un modelo lineal para cada país que prediga
life_expectancyusando todas las características del conjunto de datos. - Añade una columna (
fit) con las estadísticas de ajuste de cada modelo y simplifica este data frame. - Imprime el \(R^2\) ajustado en
fullmodel_perfde los cuatro países del data frameworst_fit.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Build a linear model for each country using all features
gap_fullmodel <- gap_nested %>%
mutate(model = map(data, ~lm(formula = ___, data = .x)))
fullmodel_perf <- gap_fullmodel %>%
# Extract the fit statistics of each model into data frames
mutate(fit = map(model, ~___(.x))) %>%
# Simplify the fit data frames for each model
unnest(___)
# View the performance for the four countries with the worst fitting four simple models you looked at before
fullmodel_perf %>%
___(country %in% worst_fit$country) %>%
select(country, adj.r.squared)