Combinar y comparar varios modelos de imputación
Para evaluar los distintos métodos de imputación, necesitamos ponerlos en un único dataframe. A continuación, compararás tres enfoques para tratar los datos faltantes usando el conjunto de datos oceanbuoys.
- El primer método usa solo los casos completos y se ha cargado como
ocean_cc. - El segundo método imputa valores con un modelo lineal con predicciones basadas en el viento y se ha cargado como
ocean_imp_lm_wind.
Crearás el tercer conjunto imputado, ocean_imp_lm_all, usando un modelo lineal e imputando las variables sea_temp_c, air_temp_c y humidity a partir de las variables wind_ew, wind_ns, year, latitude, longitude.
Después unirás todos los conjuntos de datos (ocean_cc, ocean_imp_lm_wind y ocean_imp_lm_all) y lo llamarás bound_models.
Este ejercicio forma parte del curso
Tratamiento de datos faltantes en R
Instrucciones del ejercicio
- Crea un conjunto de datos imputado llamado
ocean_imp_lm_allusando un modelo lineal e imputa las variablessea_temp_c,air_temp_cyhumiditya partir de las variableswind_ew,wind_ns,year,latitude,longitude. - Une todos los conjuntos de datos en un mismo objeto y llámalo
bound_models.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Create an imputed dataset using a linear models
ocean_imp_lm_all <- bind_shadow(oceanbuoys) %>%
add_label_shadow() %>%
impute_lm(sea_temp_c ~ wind_ew + wind_ns + ___ + ___ + ___) %>%
impute_lm(air_temp_c ~ wind_ew + wind_ns + ___ + ___ + ___) %>%
impute_lm(humidity ~ wind_ew + wind_ns + ___ + ___ + ___)
# Bind the datasets
bound_models <- bind_rows(cc = ___,
imp_lm_wind = ___,
imp_lm_all = ___,
.id = "imp_model")
# Look at the models
bound_models