LoslegenKostenlos starten

Übereinstimmungen anhand von zwei Bedingungen finden

In dieser Übung wirst du zwei Datensätze mit entsprechenden Filmtiteln abgleichen, die jedoch auch Tippfehler enthalten. In der ersten Tabelle movie_titles gibt es zehn Filme, die du mit der zweiten Tabelle movie_db abgleichen sollst. Die Daten basieren auf gescannten Dokumenten und enthalten Fehler durch die Optical-Character-Recognition-Software.

Beide Tabellen enthalten die Spalten title und year. Nutze diese, um Übereinstimmungen zu finden.

Erstelle zwei Hilfsfunktionen, die ähnliche bzw. gleiche Einträge erkennen. Eine für die Filmtitel (basiert auf stringdist()) und eine für den Vergleich der Jahre mittels abs() (liefert die Differenz).

Diese Übung ist Teil des Kurses

<Kurs>Fortgeschrittene Reguläre Ausdrücke in R</Kurs>
Kurs ansehen

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Calculate the string distance - it should be smaller than 3
is_string_distance_below_three <- function(left, right) {
  ___(left, right) < ___
}

is_string_distance_below_three("Hi there", "Hi there")
Code bearbeiten und ausführen