Syntax mit grep üben
Du hast gerade eine kleine Kennenlern-Aufgabe bei der Arbeit abgeschlossen und 10 Fakten über deine Chefin/deinen Chef festgehalten. Diese 10 Fakten hast du in einem Vektor namens text gespeichert. Mit regulären Ausdrücken möchtest du die Antworten zusammenfassen.
Ein paar Hinweise zu regulären Ausdrücken in R:
- Wenn du
grep()verwendest, sorgtvalue = TRUEdafür, dass der Text statt der Indizes ausgegeben wird. - Du kannst Muster kombinieren, z. B. eine Ziffer
"\\d"gefolgt von einem Punkt"\\."mit"\\d\\.". - Leerzeichen findest du mit
"\\s". - Du kannst nach einem Wort suchen, indem du es einfach als Muster verwendest:
pattern = 'word'
Diese Übung ist Teil des Kurses
Einführung in Natural Language Processing mit R
Anleitung zur Übung
- Gib mit
grep()den Text der Antworten aus, die eine Zahl enthalten. - Finde alle Einträge mit einer Zahl, gefolgt von einem Leerzeichen. Verwende einen regulären Ausdruck für die Zahl und das Leerzeichen.
- Verwende
length()undgrep(), um herauszufinden, wie oft du das Wort"favorite"notiert hast.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Print off each item that contained a numeric number
___(pattern = ___, x = text, value = TRUE)
# Find all items with a number followed by a space
___(pattern = ___, x = text)
# How many times did you write down 'favorite'?
length(___(pattern = ___, x = text))