Coppie di ristoranti
Nella lezione precedente, hai ripulito il dataset restaurants per prepararlo alla creazione di un motore di raccomandazione di ristoranti. Hai un nuovo DataFrame chiamato restaurants_new con nuovi ristoranti su cui addestrare il tuo modello, estratti da una nuova fonte di dati.
Hai già ripulito le colonne cuisine_type e city usando le tecniche viste nel corso. Tuttavia, hai notato duplicati con refusi nei nomi dei ristoranti che richiedono il record linkage invece di join con restaurants.
In questo esercizio, eseguirai il primo passo del record linkage e genererai possibili coppie di righe tra restaurants e restaurants_new. Entrambi i DataFrame, pandas e recordlinkage sono presenti nel tuo ambiente.
Questo esercizio fa parte del corso
Pulizia dei dati in Python
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Create an indexer and object and find possible pairs
indexer = ____
# Block pairing on cuisine_type
indexer.____(____)
# Generate pairs
pairs = indexer.____(____, ____)