Níveis em queda
A tabela de contingência do último exercício revelou que há alguns níveis com contagens muito baixas. Para simplificar a análise, muitas vezes é útil reduzir esses níveis.
No R, isso requer duas etapas: primeiro, filtrar todas as linhas com os níveis que têm contagens muito baixas e, em seguida, remover esses níveis da variável de fator com droplevels(). Isso ocorre porque a função droplevels() manteria os níveis que têm apenas 1 ou 2 contagens; ela apenas elimina os níveis que não existem em um conjunto de dados.
Este exercício faz parte do curso
Análise exploratória de dados em R
Instruções do exercício
A tabela de contingência do último exercício está disponível em seu espaço de trabalho como tab.
- Carregue o pacote
dplyr. - Imprima
tabpara descobrir qual nível dealigntem o menor número total de entradas. - Use
filter()para filtrar todas as linhas decomicscom esse nível e, em seguida, elimine o nível não utilizado comdroplevels(). Salve o conjunto de dados simplificado comocomics_filtered.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Load dplyr
___
# Print tab
___
# Remove align level
comics_filtered <- ___ %>%
___(align != ___) %>%
___()
# See the result
comics_filtered