LoslegenKostenlos starten

Edit-Distanzen vs. Q-Gram-Methoden

Die Ergebnisse verschiedener String-Distanz-Methoden können stark variieren. Bei der einen Methode liegen die Werte unter eins, bei einer anderen über 10. Deshalb ist es hilfreich, die Funktionsweise jeder Methode zu kennen.

Du hast sechs Methoden kennengelernt. Drei davon arbeiten mit einer „Edit-Distanz“ und messen, wie viele Bearbeitungsschritte nötig sind, um den ersten String in den zweiten zu überführen.

Die anderen drei funktionieren anders: Sie zerlegen einen String in Teilstrings bestimmter Länge – sogenannte Q-Grams (manchmal auch N-Grams genannt). Erinnerst du dich, welche Methoden das waren?

Diese Übung ist Teil des Kurses

<Kurs>Fortgeschrittene Reguläre Ausdrücke in R</Kurs>
Kurs ansehen

Interaktive praktische Übung

Verwandle Theorie mit einer unserer interaktiven Übungen in die Praxis

Übung starten