Levenshtein-Abstand Beispiele
Schauen wir uns nun genauer an, wie wir die Funktion levenshtein
verwenden können, um Zeichenketten mit Textdaten abzugleichen. Wenn du dich erinnerst, steht der levenshtein
Abstand für die Anzahl der Bearbeitungen, die erforderlich sind, um eine Zeichenkette in eine andere Zeichenkette umzuwandeln, die verglichen wird.
In einer Suchanwendung oder bei der Datenanalyse von Daten, die manuelle Benutzereingaben enthalten, musst du immer Tippfehler oder falsche Schreibweisen berücksichtigen. Die Funktion levenshtein
ist eine gute Methode, um diese Aufgabe zu erfüllen. In dieser Übung führen wir eine Abfrage in der Tabelle film
durch, indem wir einen Suchstring mit einem Rechtschreibfehler verwenden und die Ergebnisse von levenshtein
nutzen, um eine Übereinstimmung zu ermitteln. Schauen wir es uns an.
Diese Übung ist Teil des Kurses
Funktionen zur Manipulation von Daten in PostgreSQL
Anleitung zur Übung
- Wähle den Filmtitel und die Filmbeschreibung aus.
- Berechne den Levenshtein-Abstand für den Filmtitel mit der Zeichenfolge
JET NEIGHBOR
.
Interaktive Übung zum Anfassen
Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.
-- Select the title and description columns
SELECT
___,
___,
-- Calculate the levenshtein distance
___(___, ___) AS distance
FROM
film
ORDER BY 3