Não sou membro
Agora que você já praticou a identificação de problemas de restrição de associação, é hora de corrigir esses problemas em um novo conjunto de dados. Ao longo deste capítulo, você trabalhará com um conjunto de dados chamado sfo_survey
, que contém respostas de pesquisas de passageiros de voos do Aeroporto Internacional de São Francisco (SFO). Os participantes foram questionados sobre a limpeza do aeroporto, o tempo de espera, a segurança e sua satisfação geral.
Houve alguns problemas durante a coleta de dados que resultaram em algumas inconsistências no conjunto de dados. Neste exercício, você trabalhará com a coluna dest_size
, que categoriza o tamanho do aeroporto de destino para o qual os passageiros estavam voando. Um quadro de dados chamado dest_sizes
está disponível e contém todos os tamanhos de destino possíveis. Sua missão é encontrar linhas com dest_size
s inválido e removê-las do quadro de dados.
dplyr
foi carregado e sfo_survey
e dest_sizes
estão disponíveis.
Este exercício faz parte do curso
Limpeza de dados no R
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Count the number of occurrences of dest_size
sfo_survey %>%
count(___)