ComenzarEmpieza gratis

Imputación con regresión lineal

A veces, puedes usar tu conocimiento del dominio, investigaciones previas o simplemente el sentido común para describir las relaciones entre las variables de tus datos. En esos casos, la imputación basada en modelos es una gran solución, porque te permite imputar cada variable según un modelo estadístico que tú mismo puedes especificar, teniendo en cuenta las suposiciones que tengas sobre cómo se influyen las variables entre sí.

Para variables continuas, un modelo muy utilizado es la regresión lineal. ¡Eso no te limita a relaciones lineales! Siempre puedes incluir el cuadrado o el logaritmo de una variable entre los predictores. En este ejercicio, trabajarás con el paquete simputation para ejecutar una imputación única con regresión lineal sobre los datos tao y analizar los resultados. ¡Vamos a probarlo!

Este ejercicio forma parte del curso

Tratamiento de datos faltantes con imputaciones en R

Ver curso

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Load the simputation package
___

# Impute air_temp and humidity with linear regression
formula <- ____
tao_imp <- ___(tao, formula)
Editar y ejecutar código