Pares de restaurantes
Na última lição, você limpou o conjunto de dados restaurants
para prepará-lo para a criação de um mecanismo de recomendação de restaurantes. Você tem um novo DataFrame chamado restaurants_new
com novos restaurantes para treinar seu modelo, que foi extraído de uma nova fonte de dados.
Você já limpou as colunas cuisine_type
e city
usando as técnicas aprendidas no curso. No entanto, você viu duplicatas com erros de digitação em nomes de restaurantes que exigem vinculação de registros em vez de uniões com restaurants
.
Neste exercício, você executará a primeira etapa da vinculação de registros e gerará possíveis pares de linhas entre restaurants
e restaurants_new
. Ambos os DataFrames, pandas
e recordlinkage
, estão em seu ambiente.
Este exercício faz parte do curso
Limpeza de dados em Python
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Create an indexer and object and find possible pairs
indexer = ____
# Block pairing on cuisine_type
indexer.____(____)
# Generate pairs
pairs = indexer.____(____, ____)