ComeçarComece gratuitamente

Níveis em queda

A tabela de contingência do último exercício revelou que há alguns níveis com contagens muito baixas. Para simplificar a análise, muitas vezes é útil reduzir esses níveis.

No R, isso requer duas etapas: primeiro, filtrar todas as linhas com os níveis que têm contagens muito baixas e, em seguida, remover esses níveis da variável de fator com droplevels(). Isso ocorre porque a função droplevels() manteria os níveis que têm apenas 1 ou 2 contagens; ela apenas elimina os níveis que não existem em um conjunto de dados.

Este exercício faz parte do curso

Análise exploratória de dados em R

Ver Curso

Instruções de exercício

A tabela de contingência do último exercício está disponível em seu espaço de trabalho como tab.

  • Carregue o pacote dplyr.
  • Imprima tab para descobrir qual nível de align tem o menor número total de entradas.
  • Use filter() para filtrar todas as linhas de comics com esse nível e, em seguida, elimine o nível não utilizado com droplevels(). Salve o conjunto de dados simplificado como comics_filtered.

Exercício interativo prático

Experimente este exercício preenchendo este código de exemplo.

# Load dplyr
___

# Print tab
___

# Remove align level
comics_filtered <- ___ %>%
  ___(align != ___) %>%
  ___()

# See the result
comics_filtered
Editar e executar código