Créer une regex adaptée à vos besoins
Dans cet exercice, vous allez reproduire ce que vous venez de voir dans la vidéo en extrayant les lettres "3D" de la colonne "line" du data frame screens_per_movie.
Pour que la fonction extract() fonctionne correctement, vous devez respecter l’exigence suivante : le nombre de groupes de capture dans l’expression régulière regex doit être identique à la longueur du vecteur into. Si ce n’est pas le cas, vous obtiendrez une erreur.
Pouvez-vous résoudre ce problème afin que "3D" et un ou plusieurs chiffres \\d+ soient correctement extraits du data frame screens_per_movie ?
Cet exercice fait partie du cours
Expressions régulières intermédiaires en R
Instructions
- Créez une expression régulière
regexavec deux groupes de capture(). Leur contenu sera extrait dans les nouvelles colonnes. - Assurez-vous de ne pas supprimer la colonne de texte d’origine.
- Assurez-vous que le second groupe capturé soit converti en nombres.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
extract(
screens_per_movie,
line,
into = c("is_3d", "screens"),
# Capture two groups: "3D" and "one or more digits"
regex = "___.*?___$",
# Pass TRUE or FALSE, the original column should not be removed
remove = ___,
# Pass TRUE or FALSE, the result should get converted to numbers
convert = ___
)