De verschillende parameters in het model evalueren
We imputeren onze data met een reden: we willen de data analyseren!
In dit voorbeeld zijn we geïnteresseerd in het voorspellen van de zeetemperatuur, dus bouwen we een lineair model dat de zeetemperatuur voorspelt.
We passen dit model toe op elk van de datasets die we hebben gemaakt en verkennen vervolgens de coëfficiënten in de data.
De objecten uit de vorige les (ocean_cc, ocean_imp_lm_wind, ocean_imp_lm_all en bound_models) zijn in de workspace geladen.
Deze oefening maakt deel uit van de cursus
Omgaan met ontbrekende gegevens in R
Oefeninstructies
- Maak de model-samenvatting voor elke dataset met kolommen voor residuen met
residuals,predictentidy. - Verken de coëfficiënten in het model en zet het model met de hoogste schatting voor
air_temp_cin het object best_model
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Create the model summary for each dataset
model_summary <- bound_models %>%
group_by(imp_model) %>%
nest() %>%
mutate(mod = map(data, ~lm(sea_temp_c ~ air_temp_c + humidity + year, data = .)),
res = map(mod, ___),
pred = map(mod, ___),
tidy = map(mod, ___))
# Explore the coefficients in the model
model_summary %>%
select(___,___) %>%
unnest()
best_model <- "___"