Übereinstimmungen anhand von zwei Bedingungen finden
In dieser Übung wirst du zwei Datensätze mit entsprechenden Filmtiteln abgleichen, die jedoch auch Tippfehler enthalten. In der ersten Tabelle movie_titles gibt es zehn Filme, die du mit der zweiten Tabelle movie_db abgleichen sollst. Die Daten basieren auf gescannten Dokumenten und enthalten Fehler durch die Optical-Character-Recognition-Software.
Beide Tabellen enthalten die Spalten title und year. Nutze diese, um Übereinstimmungen zu finden.
Erstelle zwei Hilfsfunktionen, die ähnliche bzw. gleiche Einträge erkennen. Eine für die Filmtitel (basiert auf stringdist()) und eine für den Vergleich der Jahre mittels abs() (liefert die Differenz).
Diese Übung ist Teil des Kurses
Fortgeschrittene Reguläre Ausdrücke in R
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Calculate the string distance - it should be smaller than 3
is_string_distance_below_three <- function(left, right) {
___(left, right) < ___
}
is_string_distance_below_three("Hi there", "Hi there")