Montagem
Durante este capítulo, você limpou a coluna city
de zagat
usando similaridade de cadeia de caracteres, bem como gerou e comparou pares de restaurantes de zagat
e fodors
. O fim está próximo - tudo o que resta fazer é marcar e selecionar pares e vincular os dados, e você poderá começar sua análise em pouco tempo!
reclin
e dplyr
estão carregados e zagat
e fodors
estão disponíveis.
Este exercício faz parte do curso
Limpeza de dados no R
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Create pairs
pair_blocking(zagat, fodors, blocking_var = "city") %>%
# Compare pairs
compare_pairs(by = c("name", "addr"), default_comparator = jaro_winkler()) %>%
# Score pairs
___