IniziaInizia gratis

Collegare o non collegare?

Come per le join, il record linkage consiste nel collegare dati provenienti da fonti diverse che riguardano la stessa entità. Ma a differenza delle join, il record linkage non richiede corrispondenze esatte tra coppie di dati: può invece trovare corrispondenze simili usando la similarità tra stringhe. Per questo il record linkage è efficace quando non ci sono chiavi univoche comuni tra le fonti di dati su cui fare affidamento, come un identificatore univoco.

In questo esercizio, dovrai classificare ciascuna scheda come problema di join tradizionale oppure di record linkage.

Questo esercizio fa parte del corso

Pulizia dei dati in Python

Visualizza il corso

Esercizio pratico interattivo

Passa dalla teoria alla pratica con uno dei nostri esercizi interattivi

Inizia esercizio