Restaurantes similares
No último exercício, você gerou pares entre restaurants
e restaurants_new
em um esforço para mesclar de forma limpa os dois DataFrames usando a vinculação de registros.
Ao realizar a vinculação de registros, há diferentes tipos de correspondência que você pode realizar entre diferentes colunas dos seus DataFrames, incluindo correspondências exatas, semelhanças de strings e muito mais.
Agora que os pares foram gerados e armazenados em pairs
, você encontrará correspondências exatas nas colunas city
e cuisine_type
entre cada par, e strings semelhantes para cada par na coluna rest_name
. Ambos os DataFrames, pandas
e recordlinkage
, estão em seu ambiente.
Este exercício faz parte do curso
Limpeza de dados em Python
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Create a comparison object
comp_cl = ____