Costruisci modelli migliori
In precedenza hai creato una raccolta di modelli semplici per adattare la speranza di vita usando la variabile year. Dall’analisi precedente è emerso che alcuni di questi modelli non si adattavano molto bene.
In questo esercizio costruirai modelli di regressione multipla per ciascun paese usando tutte le variabili disponibili. Potresti voler confrontare le prestazioni dei quattro modelli con il peggior adattamento; di seguito sono riportati i loro \(R^2\) aggiustati:
| Country | Adjusted \(R^2\) |
|---|---|
| Botswana | -0.0060772 |
| Lesotho | -0.0169851 |
| Zambia | 0.1668999 |
| Zimbabwe | 0.2083979 |
Questo esercizio fa parte del corso
Machine Learning nel tidyverse
Istruzioni dell'esercizio
- Costruisci un modello lineare per ciascun paese che predica
life_expectancyusando tutte le variabili dell'insieme di dati. - Aggiungi una colonna (
fit) con le statistiche di adattamento per ogni modello e semplifica questo data frame. - Stampa l’\(R^2\) aggiustato in
fullmodel_perfdei quattro paesi presenti nel data frameworst_fit.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Build a linear model for each country using all features
gap_fullmodel <- gap_nested %>%
mutate(model = map(data, ~lm(formula = ___, data = .x)))
fullmodel_perf <- gap_fullmodel %>%
# Extract the fit statistics of each model into data frames
mutate(fit = map(model, ~___(.x))) %>%
# Simplify the fit data frames for each model
unnest(___)
# View the performance for the four countries with the worst fitting four simple models you looked at before
fullmodel_perf %>%
___(country %in% worst_fit$country) %>%
select(country, adj.r.squared)