ComenzarEmpieza gratis

Percibiendo el peligro de la imputación por la media

Uno de los métodos de imputación más populares es la imputación por la media, donde los valores ausentes de una variable se sustituyen por la media de los valores observados en esa variable. Sin embargo, en muchos casos este enfoque sencillo no es una buena elección. A veces, con echar un vistazo rápido a los datos ya puedes ver los riesgos de imputar con la media.

En este capítulo, trabajarás con una submuestra de los datos del proyecto Tropical Atmosphere Ocean (tao). Este conjunto de datos incluye mediciones atmosféricas tomadas en dos periodos de tiempo diferentes y en cinco ubicaciones distintas. Los datos vienen con el paquete VIM.

En este ejercicio te familiarizarás con los datos y harás un análisis sencillo que te mostrará cuáles podrían ser las consecuencias de imputar con la media. ¡Vamos a explorar los datos de tao!

Este ejercicio forma parte del curso

Tratamiento de datos faltantes con imputaciones en R

Ver curso

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Print first 10 observations
___(tao, ___)
Editar y ejecutar código