Evaluar la calidad de la imputación con un margin plot
En el ejercicio anterior, imputaste la media de air_temp y añadiste una variable indicadora para señalar qué valores se imputaron, llamada air_temp_imp. Es hora de comprobar qué tal funciona.
Al examinar los datos de tao, quizás te hayas fijado en que también contienen una variable llamada sea_surface_temp, que razonablemente se espera que esté positivamente correlacionada con air_temp. Si es así, esperarías que ambas temperaturas fueran altas o bajas a la vez. Imputar la temperatura del aire con la media cuando la temperatura del mar es alta o baja rompería esta relación.
Para comprobarlo, en este ejercicio seleccionarás las dos variables de temperatura y la variable indicadora y las usarás para dibujar un margin plot. ¡Vamos a evaluar la imputación por la media!
Este ejercicio forma parte del curso
Tratamiento de datos faltantes con imputaciones en R
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Draw a margin plot of air_temp vs sea_surface_temp
tao_imp %>%
select(___, ___, ___) %>%
___(delimiter = ___)