IniziaInizia gratis

Correggere i refusi con la distanza tra stringhe

In questo capitolo, uno degli insiemi di dati con cui lavorerai, zagat, contiene ristoranti di New York, Los Angeles, Atlanta, San Francisco e Las Vegas. I dati provengono da Zagat, un'azienda che raccoglie recensioni di ristoranti, e includono nomi dei ristoranti, indirizzi, numeri di telefono e altre informazioni sui locali.

La colonna city contiene il nome della città in cui si trova il ristorante. Tuttavia, in questa colonna ci sono diversi refusi. Il tuo compito è mappare ogni valore di city a una delle cinque città scritte correttamente presenti nel data frame cities.

dplyr e fuzzyjoin sono già caricati, e zagat e cities sono disponibili.

Questo esercizio fa parte del corso

Pulizia dei dati in R

Visualizza il corso

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Count the number of each city variation
zagat %>%
  count(___)
Modifica ed esegui il codice