ComenzarEmpieza gratis

Imputa datos por debajo del rango con datos nabular

Queremos llevar un registro de los valores que imputamos. Si no lo hacemos, es muy difícil evaluar qué tan buenos son esos valores imputados.

Vamos a practicar la imputación de datos y a recrear visualizaciones del conjunto de ejercicios anterior imputando valores por debajo del rango de los datos.

Este enfoque es muy útil para explorar mejor la ausencia de datos y, además, proporciona la base para imputar valores faltantes.

Primero, vamos a imputar los datos por debajo del rango usando impute_below_all(), y luego visualizaremos los datos. Observamos que, aunque en este caso podemos ver dónde están los valores faltantes, necesitamos alguna forma de seguirles la pista. El patrón de programación para el seguimiento de valores faltantes puede ayudarte con esto.

Este ejercicio forma parte del curso

Tratamiento de datos faltantes en R

Ver curso

Instrucciones del ejercicio

Usando los datos de oceanbuoys:

  • Imputa por debajo del rango usando impute_below_all().
  • Visualiza los nuevos valores faltantes con wind_ew en el eje x y air_temp_c en el eje y.
  • Imputa y registra los datos con bind_shadow(), impute_below_all() y add_label_shadow().
  • Muestra el gráfico e inspecciona los valores imputados.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Impute the oceanbuoys data below the range using `impute_below`.
ocean_imp <- impute_below_all(___)

# Visualize the new missing values
ggplot(___, 
       aes(x = ___, y = ___)) +  
  geom_point()

# Impute and track data with `bind_shadow`, `impute_below_all`, and `add_label_shadow`
ocean_imp_track <- bind_shadow(___) %>% 
  ___() %>% 
  ___()

# Look at the imputed values
___
Editar y ejecutar código