Aan de slagGa gratis aan de slag

Oefenen met grep-syntaxis

Je hebt net een kennismakingsspel op het werk gedaan en 10 feitjes over je baas genoteerd. Je hebt deze 10 feitjes opgeslagen in een vector text. Met reguliere expressies wil je de antwoorden van je baas samenvatten.

Een paar opmerkingen over reguliere expressies in R:

  • Bij gebruik van grep() zorgt value = TRUE ervoor dat de tekst wordt afgedrukt in plaats van de indexen.
  • Je kunt patronen combineren, zoals een cijfer, "\\d", gevolgd door een punt "\\.", tot "\\d\\."
  • Spaties kun je vinden met "\\s".
  • Je kunt naar een woord zoeken door het woord simpelweg als je patroon te gebruiken. pattern = 'word'

Deze oefening maakt deel uit van de cursus

Introductie tot Natural Language Processing in R

Cursus bekijken

Oefeninstructies

  • Gebruik grep() om de tekst van de antwoorden af te drukken die een getal bevatten.
  • Zoek alle items met een getal gevolgd door een spatie. Gebruik een reguliere expressie voor het getal en de spatie.
  • Gebruik length() en grep() om uit te vinden hoe vaak je het woord "favorite" hebt opgeschreven.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Print off each item that contained a numeric number
___(pattern = ___, x = text, value = TRUE)

# Find all items with a number followed by a space
___(pattern = ___, x = text)

# How many times did you write down 'favorite'?
length(___(pattern = ___, x = text))
Code bewerken en uitvoeren