Aan de slagBegin gratis

Overeenkomsten vinden op basis van twee voorwaarden

In deze oefening koppel je 2 gegevenssets met bijbehorende filmtitels, waarin ook typfouten voorkomen. In de eerste tabel movie_titles staan tien films die je moet matchen met de tweede tabel movie_db. Ze zijn echter gebaseerd op gescande documenten en bevatten fouten door de Optical Character Recognition-software.

Beide tabellen bevatten de kolommen title en year. Gebruik deze om overeenkomsten te vinden.

Maak 2 hulpfuncties die items matchen die gelijk of vergelijkbaar zijn. Eén voor de filmtitels (gebaseerd op stringdist()) en één voor het vergelijken van jaren met abs() (die het verschil retourneert).

Deze oefening maakt deel uit van de cursus

Gevorderde reguliere expressies in R

Bekijk cursus

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Calculate the string distance - it should be smaller than 3
is_string_distance_below_three <- function(left, right) {
  ___(left, right) < ___
}

is_string_distance_below_three("Hi there", "Hi there")
Code bewerken en uitvoeren