Oefenen met grep-syntaxis
Je hebt net een kennismakingsspel op het werk gedaan en 10 feitjes over je baas genoteerd. Je hebt deze 10 feitjes opgeslagen in een vector text. Met reguliere expressies wil je de antwoorden van je baas samenvatten.
Een paar opmerkingen over reguliere expressies in R:
- Bij gebruik van
grep()zorgtvalue = TRUEervoor dat de tekst wordt afgedrukt in plaats van de indexen. - Je kunt patronen combineren, zoals een cijfer,
"\\d", gevolgd door een punt"\\.", tot"\\d\\." - Spaties kun je vinden met
"\\s". - Je kunt naar een woord zoeken door het woord simpelweg als je patroon te gebruiken.
pattern = 'word'
Deze oefening maakt deel uit van de cursus
Introductie tot Natural Language Processing in R
Oefeninstructies
- Gebruik
grep()om de tekst van de antwoorden af te drukken die een getal bevatten. - Zoek alle items met een getal gevolgd door een spatie. Gebruik een reguliere expressie voor het getal en de spatie.
- Gebruik
length()engrep()om uit te vinden hoe vaak je het woord"favorite"hebt opgeschreven.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Print off each item that contained a numeric number
___(pattern = ___, x = text, value = TRUE)
# Find all items with a number followed by a space
___(pattern = ___, x = text)
# How many times did you write down 'favorite'?
length(___(pattern = ___, x = text))