Beispiele für die Levenshtein-Distanz
Schauen wir uns jetzt genauer an, wie wir die Funktion levenshtein nutzen können, um Zeichenfolgen mit Textdaten abzugleichen. Du erinnerst dich bestimmt, dass die Distanz nach levenshtein die Anzahl der Änderungen angibt, die nötig sind, um eine Zeichenfolge in eine andere zu verwandeln, die verglichen wird.
Bei einer Suchanwendung oder bei der Analyse von Daten, die manuelle Benutzereingaben enthalten, solltest du immer Tippfehler oder falsche Schreibweisen berücksichtigen. Dafür eignet sich die Funktion levenshtein sehr gut. In dieser Übung führen wir eine Abfrage in der Tabelle film mit einer Suchzeichenfolge durch, die einen Rechtschreibfehler enthält, und nutzen die Ergebnisse von levenshtein, um eine Übereinstimmung zu finden. Schauen wir uns das mal an.
Diese Übung ist Teil des Kurses
Funktionen zur Datenbearbeitung in PostgreSQL
Anleitung zur Übung
- Wähle den Filmtitel und die Filmbeschreibung aus.
- Berechne die Levenshtein-Distanz für den Filmtitel mit der Zeichenfolge
JET NEIGHBOR.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
-- Select the title and description columns
SELECT
___,
___,
-- Calculate the levenshtein distance
___(___, ___) AS distance
FROM
film
ORDER BY 3