ComeçarComece de graça

Correção de erros de digitação com distância de string

Neste capítulo, um dos conjuntos de dados com o qual você trabalhará, zagat, é um conjunto de restaurantes em Nova York, Los Angeles, Atlanta, São Francisco e Las Vegas. Os dados são da Zagat, uma empresa que coleta avaliações de restaurantes, e incluem os nomes, endereços e números de telefone dos restaurantes, além de outras informações sobre eles.

A coluna city contém o nome da cidade em que o restaurante está localizado. No entanto, há vários erros de digitação na coluna. Sua tarefa é mapear cada city para uma das cinco cidades com a grafia correta contidas no quadro de dados cities.

dplyr e fuzzyjoin estão carregados, e zagat e cities estão disponíveis.

Este exercício faz parte do curso

Limpeza de dados no R

Ver curso

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Count the number of each city variation
zagat %>%
  count(___)
Editar e executar o código