IniziaInizia gratis

Trovare corrispondenze basate su due condizioni

In questo esercizio, abbinerai 2 insiemi di dati con titoli di film corrispondenti, ma che contengono anche refusi. Nella prima tabella, movie_titles, ci sono dieci film che dovresti far corrispondere con la seconda tabella, movie_db. Tuttavia, provengono da documenti scansionati e contengono errori generati dal software di riconoscimento ottico dei caratteri (OCR).

Entrambe le tabelle contengono le colonne title e year. Usale per trovare le corrispondenze tra loro.

Crea 2 funzioni di supporto che trovino elementi simili o uguali. Una per i titoli dei film (basata su stringdist()) e una per confrontare gli anni, usando abs() (che restituisce il delta).

Questo esercizio fa parte del corso

Espressioni regolari intermedie in R

Visualizza il corso

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Calculate the string distance - it should be smaller than 3
is_string_distance_below_three <- function(left, right) {
  ___(left, right) < ___
}

is_string_distance_below_three("Hi there", "Hi there")
Modifica ed esegui il codice