Montagem
Durante este capítulo, você limpou a coluna city de zagat usando similaridade de cadeia de caracteres, bem como gerou e comparou pares de restaurantes de zagat e fodors. O fim está próximo - tudo o que resta fazer é marcar e selecionar pares e vincular os dados, e você poderá começar sua análise em pouco tempo!
reclin e dplyr estão carregados e zagat e fodors estão disponíveis.
Este exercício faz parte do curso
Limpeza de dados no R
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Create pairs
pair_blocking(zagat, fodors, blocking_var = "city") %>%
# Compare pairs
compare_pairs(by = c("name", "addr"), default_comparator = jaro_winkler()) %>%
# Score pairs
___