Comece agoraComece grátis

Correção de erros de digitação com distância de string

Neste capítulo, um dos conjuntos de dados com o qual você trabalhará, zagat, é um conjunto de restaurantes em Nova York, Los Angeles, Atlanta, São Francisco e Las Vegas. Os dados são da Zagat, uma empresa que coleta avaliações de restaurantes, e incluem os nomes, endereços e números de telefone dos restaurantes, além de outras informações sobre eles.

A coluna city contém o nome da cidade em que o restaurante está localizado. No entanto, há vários erros de digitação na coluna. Sua tarefa é mapear cada city para uma das cinco cidades com a grafia correta contidas no quadro de dados cities.

dplyr e fuzzyjoin estão carregados, e zagat e cities estão disponíveis.

Este exercicio faz parte do curso

Limpeza de dados no R

Ver curso

exercicio interativo prático

Tente este exercicio completando este código de exemplo.

# Count the number of each city variation
zagat %>%
  count(___)
Editar e Executar Código