IniziaInizia gratis

Collegare o fare una join?

Simile alle join, il record linkage consiste nel collegare dati provenienti da fonti diverse che si riferiscono alla stessa entità. Ma, a differenza delle join, il record linkage non richiede corrispondenze esatte tra coppie di dati: può invece trovare corrispondenze simili usando la similarità tra stringhe. Per questo il record linkage è efficace quando non esistono chiavi univoche comuni tra le fonti, come ad esempio un identificatore univoco, su cui poter fare affidamento durante il collegamento.

In questo esercizio, deciderai qual è il metodo migliore per risolvere ciascun problema.

Questo esercizio fa parte del corso

Pulizia dei dati in R

Visualizza il corso

Esercizio pratico interattivo

Passa dalla teoria alla pratica con uno dei nostri esercizi interattivi

Inizia esercizio