IniziaInizia gratis

Costruisci modelli migliori

In precedenza hai creato una raccolta di modelli semplici per adattare la speranza di vita usando la variabile year. Dall’analisi precedente è emerso che alcuni di questi modelli non si adattavano molto bene.

In questo esercizio costruirai modelli di regressione multipla per ciascun paese usando tutte le variabili disponibili. Potresti voler confrontare le prestazioni dei quattro modelli con il peggior adattamento; di seguito sono riportati i loro \(R^2\) aggiustati:

Country Adjusted \(R^2\)
Botswana -0.0060772
Lesotho -0.0169851
Zambia 0.1668999
Zimbabwe 0.2083979

Questo esercizio fa parte del corso

Machine Learning nel tidyverse

Visualizza il corso

Istruzioni dell'esercizio

  • Costruisci un modello lineare per ciascun paese che predica life_expectancy usando tutte le variabili dell'insieme di dati.
  • Aggiungi una colonna (fit) con le statistiche di adattamento per ogni modello e semplifica questo data frame.
  • Stampa l’\(R^2\) aggiustato in fullmodel_perf dei quattro paesi presenti nel data frame worst_fit.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Build a linear model for each country using all features
gap_fullmodel <- gap_nested %>% 
  mutate(model = map(data, ~lm(formula = ___, data = .x)))

fullmodel_perf <- gap_fullmodel %>% 
  # Extract the fit statistics of each model into data frames
  mutate(fit = map(model, ~___(.x))) %>% 
  # Simplify the fit data frames for each model
  unnest(___)
  
# View the performance for the four countries with the worst fitting four simple models you looked at before
fullmodel_perf %>% 
  ___(country %in% worst_fit$country) %>% 
  select(country, adj.r.squared)
Modifica ed esegui il codice