Trovare corrispondenze basate su due condizioni
In questo esercizio, abbinerai 2 insiemi di dati con titoli di film corrispondenti, ma che contengono anche refusi. Nella prima tabella, movie_titles, ci sono dieci film che dovresti far corrispondere con la seconda tabella, movie_db. Tuttavia, provengono da documenti scansionati e contengono errori generati dal software di riconoscimento ottico dei caratteri (OCR).
Entrambe le tabelle contengono le colonne title e year. Usale per trovare le corrispondenze tra loro.
Crea 2 funzioni di supporto che trovino elementi simili o uguali. Una per i titoli dei film (basata su stringdist()) e una per confrontare gli anni, usando abs() (che restituisce il delta).
Questo esercizio fa parte del corso
Espressioni regolari intermedie in R
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Calculate the string distance - it should be smaller than 3
is_string_distance_below_three <- function(left, right) {
___(left, right) < ___
}
is_string_distance_below_three("Hi there", "Hi there")