ComeçarComece de graça

Pares de restaurantes

Na última lição, você limpou o conjunto de dados restaurants para prepará-lo para a criação de um mecanismo de recomendação de restaurantes. Você tem um novo DataFrame chamado restaurants_new com novos restaurantes para treinar seu modelo, que foi extraído de uma nova fonte de dados.

Você já limpou as colunas cuisine_type e city usando as técnicas aprendidas no curso. No entanto, você viu duplicatas com erros de digitação em nomes de restaurantes que exigem vinculação de registros em vez de uniões com restaurants.

Neste exercício, você executará a primeira etapa da vinculação de registros e gerará possíveis pares de linhas entre restaurants e restaurants_new. Ambos os DataFrames, pandas e recordlinkage, estão em seu ambiente.

Este exercício faz parte do curso

Limpeza de dados em Python

Ver curso

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Create an indexer and object and find possible pairs
indexer = ____

# Block pairing on cuisine_type
indexer.____(____)

# Generate pairs
pairs = indexer.____(____, ____)
Editar e executar o código