ComenzarEmpieza gratis

Combinar y comparar varios modelos de imputación

Para evaluar los distintos métodos de imputación, necesitamos ponerlos en un único dataframe. A continuación, compararás tres enfoques para tratar los datos faltantes usando el conjunto de datos oceanbuoys.

  • El primer método usa solo los casos completos y se ha cargado como ocean_cc.
  • El segundo método imputa valores con un modelo lineal con predicciones basadas en el viento y se ha cargado como ocean_imp_lm_wind.

Crearás el tercer conjunto imputado, ocean_imp_lm_all, usando un modelo lineal e imputando las variables sea_temp_c, air_temp_c y humidity a partir de las variables wind_ew, wind_ns, year, latitude, longitude.

Después unirás todos los conjuntos de datos (ocean_cc, ocean_imp_lm_wind y ocean_imp_lm_all) y lo llamarás bound_models.

Este ejercicio forma parte del curso

Tratamiento de datos faltantes en R

Ver curso

Instrucciones del ejercicio

  • Crea un conjunto de datos imputado llamado ocean_imp_lm_all usando un modelo lineal e imputa las variables sea_temp_c, air_temp_c y humidity a partir de las variables wind_ew, wind_ns, year, latitude, longitude.
  • Une todos los conjuntos de datos en un mismo objeto y llámalo bound_models.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Create an imputed dataset using a linear models
ocean_imp_lm_all <- bind_shadow(oceanbuoys) %>%
  add_label_shadow() %>%
  impute_lm(sea_temp_c ~ wind_ew + wind_ns + ___ + ___ + ___) %>%
  impute_lm(air_temp_c ~ wind_ew + wind_ns + ___ + ___ + ___) %>%
  impute_lm(humidity ~ wind_ew + wind_ns + ___ + ___ + ___)

# Bind the datasets
bound_models <- bind_rows(cc = ___,
                          imp_lm_wind = ___,
                          imp_lm_all = ___,
                          .id = "imp_model")
# Look at the models
bound_models
Editar y ejecutar código