Aan de slagGa gratis aan de slag

De verschillende parameters in het model evalueren

We imputeren onze data met een reden: we willen de data analyseren!

In dit voorbeeld zijn we geïnteresseerd in het voorspellen van de zeetemperatuur, dus bouwen we een lineair model dat de zeetemperatuur voorspelt.

We passen dit model toe op elk van de datasets die we hebben gemaakt en verkennen vervolgens de coëfficiënten in de data.

De objecten uit de vorige les (ocean_cc, ocean_imp_lm_wind, ocean_imp_lm_all en bound_models) zijn in de workspace geladen.

Deze oefening maakt deel uit van de cursus

Omgaan met ontbrekende gegevens in R

Cursus bekijken

Oefeninstructies

  • Maak de model-samenvatting voor elke dataset met kolommen voor residuen met residuals, predict en tidy.
  • Verken de coëfficiënten in het model en zet het model met de hoogste schatting voor air_temp_c in het object best_model

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Create the model summary for each dataset
model_summary <- bound_models %>% 
  group_by(imp_model) %>%
  nest() %>%
  mutate(mod = map(data, ~lm(sea_temp_c ~ air_temp_c + humidity + year, data = .)),
         res = map(mod, ___),
         pred = map(mod, ___),
         tidy = map(mod, ___))

# Explore the coefficients in the model
model_summary %>% 
	select(___,___) %>% 
	unnest()
best_model <- "___"
Code bewerken en uitvoeren