Aan de slagGa gratis aan de slag

Overeenkomsten vinden op basis van twee voorwaarden

In deze oefening koppel je 2 gegevenssets met bijbehorende filmtitels, waarin ook typfouten voorkomen. In de eerste tabel movie_titles staan tien films die je moet matchen met de tweede tabel movie_db. Ze zijn echter gebaseerd op gescande documenten en bevatten fouten door de Optical Character Recognition-software.

Beide tabellen bevatten de kolommen title en year. Gebruik deze om overeenkomsten te vinden.

Maak 2 hulpfuncties die items matchen die gelijk of vergelijkbaar zijn. Eén voor de filmtitels (gebaseerd op stringdist()) en één voor het vergelijken van jaren met abs() (die het verschil retourneert).

Deze oefening maakt deel uit van de cursus

Gevorderde reguliere expressies in R

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Calculate the string distance - it should be smaller than 3
is_string_distance_below_three <- function(left, right) {
  ___(left, right) < ___
}

is_string_distance_below_three("Hi there", "Hi there")
Code bewerken en uitvoeren