Correggere i refusi con la distanza tra stringhe
In questo capitolo, uno degli insiemi di dati con cui lavorerai, zagat, contiene ristoranti di New York, Los Angeles, Atlanta, San Francisco e Las Vegas. I dati provengono da Zagat, un'azienda che raccoglie recensioni di ristoranti, e includono nomi dei ristoranti, indirizzi, numeri di telefono e altre informazioni sui locali.
La colonna city contiene il nome della città in cui si trova il ristorante. Tuttavia, in questa colonna ci sono diversi refusi. Il tuo compito è mappare ogni valore di city a una delle cinque città scritte correttamente presenti nel data frame cities.
dplyr e fuzzyjoin sono già caricati, e zagat e cities sono disponibili.
Questo esercizio fa parte del corso
Pulizia dei dati in R
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Count the number of each city variation
zagat %>%
count(___)