Mettere tutto insieme
In questo capitolo, hai ripulito la colonna city di zagat usando la similarità tra stringhe e hai anche generato e confrontato coppie di ristoranti da zagat e fodors. Ci siamo quasi: manca solo assegnare un punteggio alle coppie, selezionare quelle giuste e collegare i dati, e potrai iniziare l'analisi in un attimo!
reclin e dplyr sono caricati e zagat e fodors sono disponibili.
Questo esercizio fa parte del corso
Pulizia dei dati in R
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Create pairs
pair_blocking(zagat, fodors, blocking_var = "city") %>%
# Compare pairs
compare_pairs(by = c("name", "addr"), default_comparator = jaro_winkler()) %>%
# Score pairs
___