Alle Capturing Groups abgleichen

In dieser Übung arbeitest du mit einer Textdatei namens top_10, die Filmtitel und ihren Rang speichert. In diesem mehrzeiligen Text wird \\n verwendet, um eine neue Zeile zu beginnen. Du verwendest die Funktion str_split(), um die Textdatei in mehrere Zeilen zu teilen.

Die neu erstellte einzeilige Matrix top_10_lines enthält dann zehn Zeilen mit demselben Muster: der Rang des Films, gefolgt von einem Punkt und einem Leerzeichen, und anschließend der Filmtitel selbst. Die Funktion str_match() und zwei Capturing Groups () ermöglichen es, diese beiden Informationen aus dem reinen Text in eine tabellarische Form zu extrahieren.

Diese Übung ist Teil des Kurses

Fortgeschrittene Reguläre Ausdrücke in R

Kurs anzeigen

Anleitung zur Übung

Verwende die Funktion str_split(), um den Text in seine Zeilen zu teilen, und gib durch Aktivieren von simplify eine Zeichenmatrix aus.
Mach dich mit der Struktur einer Zeile vertraut. Sie enthält den Rang und den Titel eines Films.
Extrahiere den Rang und den Titel eines Films, indem du Capturing Groups in der Funktion str_match() verwendest.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Split the input by line break and enable simplify
top_10_lines <- str_split(
  top_10,
  pattern = "___",
  simplify = ___
)

# Inspect the first three lines and analyze their form
___[1:3]

# Add to the pattern two capturing groups that match rank and title
str_match(
  top_10_lines,
  pattern = "___\\. ___"
)

Code bearbeiten und ausführen