Coppie di ristoranti
Nell'ultima lezione, hai ripulito il dataset restaurants per prepararlo alla costruzione di un motore di raccomandazione di ristoranti. Hai un nuovo DataFrame chiamato restaurants_new con nuovi ristoranti su cui addestrare il tuo modello, estratto da una nuova fonte di dati.
Hai già pulito le colonne cuisine_type e city usando le tecniche apprese durante il corso. Tuttavia, hai trovato duplicati con refusi nei nomi dei ristoranti che richiedono il record linkage invece di join con restaurants.
In questo esercizio, eseguirai il primo passaggio del record linkage e genererai possibili coppie di righe tra restaurants e restaurants_new. Entrambi i DataFrame, pandas e recordlinkage sono nel tuo ambiente.
Questo esercizio fa parte del corso
Pulizia dei dati in Python
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Create an indexer and object and find possible pairs
indexer = ____
# Block pairing on cuisine_type
indexer.____(____)
# Generate pairs
pairs = indexer.____(____, ____)