Níveis em queda
A tabela de contingência do último exercício revelou que há alguns níveis com contagens muito baixas. Para simplificar a análise, muitas vezes é útil reduzir esses níveis.
No R, isso requer duas etapas: primeiro, filtrar todas as linhas com os níveis que têm contagens muito baixas e, em seguida, remover esses níveis da variável de fator com droplevels()
. Isso ocorre porque a função droplevels()
manteria os níveis que têm apenas 1 ou 2 contagens; ela apenas elimina os níveis que não existem em um conjunto de dados.
Este exercício faz parte do curso
Análise exploratória de dados em R
Instruções de exercício
A tabela de contingência do último exercício está disponível em seu espaço de trabalho como tab
.
- Carregue o pacote
dplyr
. - Imprima
tab
para descobrir qual nível dealign
tem o menor número total de entradas. - Use
filter()
para filtrar todas as linhas decomics
com esse nível e, em seguida, elimine o nível não utilizado comdroplevels()
. Salve o conjunto de dados simplificado comocomics_filtered
.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Load dplyr
___
# Print tab
___
# Remove align level
comics_filtered <- ___ %>%
___(align != ___) %>%
___()
# See the result
comics_filtered