Quand vous ne savez pas exactement ce que vous cherchez
Jusqu’ici, vous avez utilisé str_detect() qui renvoie TRUE si le motif correspond et FALSE sinon. Mais les expressions régulières excellent aussi pour extraire le terme recherché d’un texte plus long. Pour cela, vous pouvez utiliser la fonction str_match().
Le prochain caractère spécial à connaître est le point : ".". Le point correspond à n’importe quel caractère, c’est un joker. Ainsi, si vous cherchez par exemple "...", vous trouverez trois caractères — qu’il s’agisse de lettres, de chiffres ou même d’espaces.
C’est très pratique, sauf si vous devez chercher un véritable point ".". Dans ce cas, échappez le point avec deux antislashs : "\\."
Cet exercice fait partie du cours
Expressions régulières intermédiaires en R
Instructions
- Faites correspondre non seulement
Saw 4mais aussi les autres suites. - Faites correspondre les quatre premiers caractères de tous les titres de films qui commencent par
"K". - Détectez le film qui se termine par un véritable point
".".
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Here's an example pattern that will find the movie Saw 4
str_match(movie_titles, pattern = "Saw 4")
# Match all sequels of the movie "Saw"
str_match(movie_titles, pattern = "___")
# Match the letter K and three arbitrary characters
str_match(movie_titles, pattern = "^K___")
# Detect whether the movie titles end with a full stop
str_detect(movie_titles, pattern = "___$")