LoslegenKostenlos loslegen

Alle Capturing Groups abgleichen

In dieser Übung arbeitest du mit einer Textdatei namens top_10, die Filmtitel und ihren Rang speichert. In diesem mehrzeiligen Text wird \\n verwendet, um eine neue Zeile zu beginnen. Du verwendest die Funktion str_split(), um die Textdatei in mehrere Zeilen zu teilen.

Die neu erstellte einzeilige Matrix top_10_lines enthält dann zehn Zeilen mit demselben Muster: der Rang des Films, gefolgt von einem Punkt und einem Leerzeichen, und anschließend der Filmtitel selbst. Die Funktion str_match() und zwei Capturing Groups () ermöglichen es, diese beiden Informationen aus dem reinen Text in eine tabellarische Form zu extrahieren.

Diese Übung ist Teil des Kurses

Fortgeschrittene Reguläre Ausdrücke in R

Kurs anzeigen

Anleitung zur Übung

  • Verwende die Funktion str_split(), um den Text in seine Zeilen zu teilen, und gib durch Aktivieren von simplify eine Zeichenmatrix aus.
  • Mach dich mit der Struktur einer Zeile vertraut. Sie enthält den Rang und den Titel eines Films.
  • Extrahiere den Rang und den Titel eines Films, indem du Capturing Groups in der Funktion str_match() verwendest.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Split the input by line break and enable simplify
top_10_lines <- str_split(
  top_10,
  pattern = "___",
  simplify = ___
)

# Inspect the first three lines and analyze their form
___[1:3]

# Add to the pattern two capturing groups that match rank and title
str_match(
  top_10_lines,
  pattern = "___\\. ___"
)
Code bearbeiten und ausführen