LoslegenKostenlos loslegen

Übereinstimmungen anhand von zwei Bedingungen finden

In dieser Übung wirst du zwei Datensätze mit entsprechenden Filmtiteln abgleichen, die jedoch auch Tippfehler enthalten. In der ersten Tabelle movie_titles gibt es zehn Filme, die du mit der zweiten Tabelle movie_db abgleichen sollst. Die Daten basieren auf gescannten Dokumenten und enthalten Fehler durch die Optical-Character-Recognition-Software.

Beide Tabellen enthalten die Spalten title und year. Nutze diese, um Übereinstimmungen zu finden.

Erstelle zwei Hilfsfunktionen, die ähnliche bzw. gleiche Einträge erkennen. Eine für die Filmtitel (basiert auf stringdist()) und eine für den Vergleich der Jahre mittels abs() (liefert die Differenz).

Diese Übung ist Teil des Kurses

Fortgeschrittene Reguläre Ausdrücke in R

Kurs anzeigen

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Calculate the string distance - it should be smaller than 3
is_string_distance_below_three <- function(left, right) {
  ___(left, right) < ___
}

is_string_distance_below_three("Hi there", "Hi there")
Code bearbeiten und ausführen