LoslegenKostenlos loslegen

Eine Regex erstellen, die zu deinen Anforderungen passt

In dieser Übung wiederholst du das, was du gerade im Video gesehen hast, und extrahierst die Buchstaben "3D" aus der Spalte "line" des Data Frames screens_per_movie.

Damit die Funktion extract() korrekt funktioniert, muss folgende Bedingung erfüllt sein: Die Anzahl der Capturing Groups im regulären Ausdruck regex muss identisch mit der Länge des Vektors into sein. Ist das nicht der Fall, erhältst du einen Fehler.

Kannst du dieses Problem lösen, sodass "3D" und eine oder mehrere Ziffern \\d+ korrekt aus dem Data Frame screens_per_movie extrahiert werden?

Diese Übung ist Teil des Kurses

Fortgeschrittene Reguläre Ausdrücke in R

Kurs anzeigen

Anleitung zur Übung

  • Erstelle einen regulären Ausdruck regex mit zwei Capturing Groups (). Deren Inhalte werden in die neuen Spalten extrahiert.
  • Stelle sicher, dass du die ursprüngliche Textspalte nicht entfernst.
  • Stelle sicher, dass die zweite erfasste Gruppe in Zahlen konvertiert wird.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

extract(
  screens_per_movie,
  line,
  into = c("is_3d", "screens"),
  # Capture two groups: "3D" and "one or more digits"
  regex = "___.*?___$",
  # Pass TRUE or FALSE, the original column should not be removed
  remove = ___,
  # Pass TRUE or FALSE, the result should get converted to numbers
  convert = ___
)
Code bearbeiten und ausführen