CommencerCommencer gratuitement

Créer une regex adaptée à vos besoins

Dans cet exercice, vous allez reproduire ce que vous venez de voir dans la vidéo en extrayant les lettres "3D" de la colonne "line" du data frame screens_per_movie.

Pour que la fonction extract() fonctionne correctement, vous devez respecter l’exigence suivante : le nombre de groupes de capture dans l’expression régulière regex doit être identique à la longueur du vecteur into. Si ce n’est pas le cas, vous obtiendrez une erreur.

Pouvez-vous résoudre ce problème afin que "3D" et un ou plusieurs chiffres \\d+ soient correctement extraits du data frame screens_per_movie ?

Cet exercice fait partie du cours

Expressions régulières intermédiaires en R

Afficher le cours

Instructions

  • Créez une expression régulière regex avec deux groupes de capture (). Leur contenu sera extrait dans les nouvelles colonnes.
  • Assurez-vous de ne pas supprimer la colonne de texte d’origine.
  • Assurez-vous que le second groupe capturé soit converti en nombres.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

extract(
  screens_per_movie,
  line,
  into = c("is_3d", "screens"),
  # Capture two groups: "3D" and "one or more digits"
  regex = "___.*?___$",
  # Pass TRUE or FALSE, the original column should not be removed
  remove = ___,
  # Pass TRUE or FALSE, the result should get converted to numbers
  convert = ___
)
Modifier et exécuter le code