Removendo níveis
A tabela de contingência do último exercício mostrou que há alguns níveis com contagens muito baixas. Para simplificar a análise, muitas vezes vale a pena remover esses níveis.
Em R, isso requer duas etapas: primeiro, filtrar quaisquer linhas com os níveis que têm contagens muito baixas e, depois, remover esses níveis da variável fator com droplevels(). Isso porque a função droplevels() manteria níveis que têm apenas 1 ou 2 ocorrências; ela só remove níveis que não existem no conjunto de dados.
Este exercício faz parte do curso
Análise Exploratória de Dados em R
Instruções do exercício
A tabela de contingência do último exercício está disponível no seu workspace como tab.
- Carregue o pacote
dplyr. - Imprima
tabpara descobrir qual nível dealigntem o menor número total de entradas. - Use
filter()para remover todas as linhas decomicscom esse nível e, em seguida, elimine o nível não utilizado comdroplevels(). Salve o conjunto de dados simplificado comocomics_filtered.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Load dplyr
___
# Print tab
___
# Remove align level
comics_filtered <- ___ %>%
___(align != ___) %>%
___()
# See the result
comics_filtered