Creación de datos de matriz sombra
Los datos faltantes pueden ser complicados de detectar: no suelen anunciarse y se esconden entre el resto de los datos.
Una forma de sacarlos a la luz es cambiar cómo pensamos sobre los datos: considerar cada valor como faltante o no faltante.
La función as_shadow() en R transforma un dataframe en una matriz sombra, un formato especial donde los valores son faltantes (NA) o no faltantes (!NA).
Los nombres de columna de una matriz sombra son los mismos que los de los datos, pero con el sufijo _NA.
Para llevar el control y comparar los valores con su estado de ausencia, usa la función bind_shadow(). Tener los datos en este formato, con la matriz sombra unida a los datos originales, se llama datos nabular.
Este ejercicio forma parte del curso
Tratamiento de datos faltantes en R
Instrucciones del ejercicio
Usando el conjunto de datos oceanbuoys:
- Crea datos de matriz sombra con
as_shadow() - Crea datos nabular uniendo la sombra a los datos con
bind_shadow() - Une solo las variables con valores faltantes usando
bind_shadow(only_miss = TRUE)
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Create shadow matrix data with `as_shadow()`
___(___)
# Create nabular data by binding the shadow to the data with `bind_shadow()`
___(___)
# Bind only the variables with missing values by using bind_shadow(only_miss = TRUE)
___(___, ___ = TRUE)