Crear una regex que se ajuste a tus necesidades
En este ejercicio vas a replicar lo que acabas de ver en el ejercicio en vídeo extrayendo las letras "3D" de la columna "line" del data frame screens_per_movie.
Para que la función extract() funcione correctamente, debes asegurarte de cumplir este requisito: el número de grupos de captura en la expresión regular regex debe ser idéntico a la longitud del vector into. Si no es así, aparecerá un error.
¿Puedes resolver este problema para que "3D" y uno o más dígitos \\d+ se extraigan correctamente del data frame screens_per_movie?
Este ejercicio forma parte del curso
Expresiones regulares intermedias en R
Instrucciones del ejercicio
- Crea una expresión regular
regexque tenga dos grupos de captura(). Su contenido se extraerá a las nuevas columnas. - Asegúrate de no eliminar la columna de texto original.
- Asegúrate de que el segundo grupo capturado se convierta a números.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
extract(
screens_per_movie,
line,
into = c("is_3d", "screens"),
# Capture two groups: "3D" and "one or more digits"
regex = "___.*?___$",
# Pass TRUE or FALSE, the original column should not be removed
remove = ___,
# Pass TRUE or FALSE, the result should get converted to numbers
convert = ___
)