ComeçarComece gratuitamente

Não sou membro

Agora que você já praticou a identificação de problemas de restrição de associação, é hora de corrigir esses problemas em um novo conjunto de dados. Ao longo deste capítulo, você trabalhará com um conjunto de dados chamado sfo_survey, que contém respostas de pesquisas de passageiros de voos do Aeroporto Internacional de São Francisco (SFO). Os participantes foram questionados sobre a limpeza do aeroporto, o tempo de espera, a segurança e sua satisfação geral.

Houve alguns problemas durante a coleta de dados que resultaram em algumas inconsistências no conjunto de dados. Neste exercício, você trabalhará com a coluna dest_size, que categoriza o tamanho do aeroporto de destino para o qual os passageiros estavam voando. Um quadro de dados chamado dest_sizes está disponível e contém todos os tamanhos de destino possíveis. Sua missão é encontrar linhas com dest_sizes inválido e removê-las do quadro de dados.

dplyr foi carregado e sfo_survey e dest_sizes estão disponíveis.

Este exercício faz parte do curso

Limpeza de dados no R

Ver Curso

Exercício interativo prático

Experimente este exercício preenchendo este código de exemplo.

# Count the number of occurrences of dest_size
sfo_survey %>%
  count(___)
Editar e executar código