ComenzarEmpieza gratis

Evaluar la calidad de la imputación con un margin plot

En el ejercicio anterior, imputaste la media de air_temp y añadiste una variable indicadora para señalar qué valores se imputaron, llamada air_temp_imp. Es hora de comprobar qué tal funciona.

Al examinar los datos de tao, quizás te hayas fijado en que también contienen una variable llamada sea_surface_temp, que razonablemente se espera que esté positivamente correlacionada con air_temp. Si es así, esperarías que ambas temperaturas fueran altas o bajas a la vez. Imputar la temperatura del aire con la media cuando la temperatura del mar es alta o baja rompería esta relación.

Para comprobarlo, en este ejercicio seleccionarás las dos variables de temperatura y la variable indicadora y las usarás para dibujar un margin plot. ¡Vamos a evaluar la imputación por la media!

Este ejercicio forma parte del curso

Tratamiento de datos faltantes con imputaciones en R

Ver curso

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Draw a margin plot of air_temp vs sea_surface_temp
tao_imp %>% 
  select(___, ___, ___) %>%
  ___(delimiter = ___)
Editar y ejecutar código