Alle Capturing Groups abgleichen
In dieser Übung arbeitest du mit einer Textdatei namens top_10, die Filmtitel und ihren Rang speichert. In diesem mehrzeiligen Text wird \\n verwendet, um eine neue Zeile zu beginnen. Du verwendest die Funktion str_split(), um die Textdatei in mehrere Zeilen zu teilen.
Die neu erstellte einzeilige Matrix top_10_lines enthält dann zehn Zeilen mit demselben Muster: der Rang des Films, gefolgt von einem Punkt und einem Leerzeichen, und anschließend der Filmtitel selbst. Die Funktion str_match() und zwei Capturing Groups () ermöglichen es, diese beiden Informationen aus dem reinen Text in eine tabellarische Form zu extrahieren.
Diese Übung ist Teil des Kurses
Fortgeschrittene Reguläre Ausdrücke in R
Anleitung zur Übung
- Verwende die Funktion
str_split(), um den Text in seine Zeilen zu teilen, und gib durch Aktivieren vonsimplifyeine Zeichenmatrix aus. - Mach dich mit der Struktur einer Zeile vertraut. Sie enthält den Rang und den Titel eines Films.
- Extrahiere den Rang und den Titel eines Films, indem du Capturing Groups in der Funktion
str_match()verwendest.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Split the input by line break and enable simplify
top_10_lines <- str_split(
top_10,
pattern = "___",
simplify = ___
)
# Inspect the first three lines and analyze their form
___[1:3]
# Add to the pattern two capturing groups that match rank and title
str_match(
top_10_lines,
pattern = "___\\. ___"
)