or
Diese Übung ist Teil des Kurses
Reguläre Ausdrücke können anfangs ziemlich einschüchternd wirken, weil sie viele Sonderzeichen enthalten. In diesem Kapitel lernst du, diese zu entschlüsseln und eigene Muster zu schreiben, um genau das zu finden, wonach du suchst.
Aktuelle Übung
In diesem Kapitel entfernen wir uns ein wenig von regulären Ausdrücken und konzentrieren uns auf String-Manipulation, indem wir Zeichenketten aus anderen Datenstrukturen wie Vektoren oder Listen erstellen.
Eine Aufgabe, in der reguläre Ausdrücke besonders glänzen, ist, aus einem Textblock Sinn zu gewinnen. In diesem Kapitel lernst du, Informationen aus unübersichtlichen Daten zu extrahieren, die nicht in sauber angeordneten Tabellen vorliegen, sondern als reiner Text.
Im letzten Kapitel wechseln wir den Fokus von regulären Ausdrücken hin zu String-Distanzen. Indem wir die Unterschiede zwischen mehreren Zeichenketten berechnen, können wir ähnliche zueinander in Beziehung setzen. Das hilft uns, Duplikate zu finden, selbst wenn sie kleine Fehler wie Tippfehler enthalten. Das ist ein wichtiger Teil des Record Linkage, bei dem wir Datensätze aus mehreren Quellen zusammenführen.