Montaje
Durante este capítulo, has limpiado la columna city
de zagat
utilizando la similitud de cadenas, así como generado y comparado pares de restaurantes de zagat
y fodors
. El final está cerca: todo lo que queda por hacer es puntuar y seleccionar los pares y vincular los datos entre sí, ¡y podrás empezar tu análisis en un abrir y cerrar de ojos!
reclin
y dplyr
están cargados y zagat
y fodors
están disponibles.
Este ejercicio forma parte del curso
Limpieza de datos en R
Ejercicio interactivo práctico
Prueba este ejercicio completando el código de muestra.
# Create pairs
pair_blocking(zagat, fodors, blocking_var = "city") %>%
# Compare pairs
compare_pairs(by = c("name", "addr"), default_comparator = jaro_winkler()) %>%
# Score pairs
___