ComeçarComece de graça

Removendo níveis

A tabela de contingência do último exercício mostrou que há alguns níveis com contagens muito baixas. Para simplificar a análise, muitas vezes vale a pena remover esses níveis.

Em R, isso requer duas etapas: primeiro, filtrar quaisquer linhas com os níveis que têm contagens muito baixas e, depois, remover esses níveis da variável fator com droplevels(). Isso porque a função droplevels() manteria níveis que têm apenas 1 ou 2 ocorrências; ela só remove níveis que não existem no conjunto de dados.

Este exercício faz parte do curso

Análise Exploratória de Dados em R

Ver curso

Instruções do exercício

A tabela de contingência do último exercício está disponível no seu workspace como tab.

  • Carregue o pacote dplyr.
  • Imprima tab para descobrir qual nível de align tem o menor número total de entradas.
  • Use filter() para remover todas as linhas de comics com esse nível e, em seguida, elimine o nível não utilizado com droplevels(). Salve o conjunto de dados simplificado como comics_filtered.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Load dplyr
___

# Print tab
___

# Remove align level
comics_filtered <- ___ %>%
  ___(align != ___) %>%
  ___()

# See the result
comics_filtered
Editar e executar o código