ComeçarComece de graça

Montagem

Durante este capítulo, você limpou a coluna city de zagat usando similaridade de cadeia de caracteres, bem como gerou e comparou pares de restaurantes de zagat e fodors. O fim está próximo - tudo o que resta fazer é marcar e selecionar pares e vincular os dados, e você poderá começar sua análise em pouco tempo!

reclin e dplyr estão carregados e zagat e fodors estão disponíveis.

Este exercício faz parte do curso

Limpeza de dados no R

Ver curso

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Create pairs
pair_blocking(zagat, fodors, blocking_var = "city") %>%
  # Compare pairs
  compare_pairs(by = c("name", "addr"), default_comparator = jaro_winkler()) %>%
  # Score pairs
  ___
Editar e executar o código