Criando dados de matriz sombra
Lidar com dados ausentes pode ser complicado, porque eles geralmente não se anunciam — ficam escondidos no meio dos dados.
Uma forma de expor valores ausentes é mudar a maneira como pensamos sobre o conjunto de dados: considerar cada valor individual como ausente ou não ausente.
A função as_shadow() em R transforma um dataframe em uma matriz sombra, um formato especial em que os valores são ausentes (NA) ou Não Ausentes (!NA).
Os nomes das colunas de uma matriz sombra são os mesmos dos dados, mas com o sufixo _NA.
Para acompanhar e comparar os valores dos dados com seu estado de ausência, use a função bind_shadow(). Ter os dados nesse formato, com as colunas da matriz sombra anexadas aos dados originais, é chamado de dados nabular.
Este exercício faz parte do curso
Lidando com dados ausentes em R
Instruções do exercício
Usando o conjunto de dados oceanbuoys:
- Crie dados de matriz sombra com
as_shadow() - Crie dados nabular vinculando a matriz sombra aos dados com
bind_shadow() - Vincule apenas as variáveis com valores ausentes usando
bind_shadow(only_miss = TRUE)
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Create shadow matrix data with `as_shadow()`
___(___)
# Create nabular data by binding the shadow to the data with `bind_shadow()`
___(___)
# Bind only the variables with missing values by using bind_shadow(only_miss = TRUE)
___(___, ___ = TRUE)