ComenzarEmpieza gratis

Montaje

Durante este capítulo, has limpiado la columna city de zagat utilizando la similitud de cadenas, así como generado y comparado pares de restaurantes de zagat y fodors. El final está cerca: todo lo que queda por hacer es puntuar y seleccionar los pares y vincular los datos entre sí, ¡y podrás empezar tu análisis en un abrir y cerrar de ojos!

reclin y dplyr están cargados y zagat y fodors están disponibles.

Este ejercicio forma parte del curso

Limpieza de datos en R

Ver curso

Ejercicio interactivo práctico

Prueba este ejercicio completando el código de muestra.

# Create pairs
pair_blocking(zagat, fodors, blocking_var = "city") %>%
  # Compare pairs
  compare_pairs(by = c("name", "addr"), default_comparator = jaro_winkler()) %>%
  # Score pairs
  ___
Editar y ejecutar código