Criando uma regex que atenda às suas necessidades
Neste exercício, você vai reproduzir o que acabou de ver no vídeo, extraindo as letras "3D" da coluna "line" do data frame screens_per_movie.
Para que a função extract() funcione corretamente, você precisa garantir o seguinte requisito: o número de grupos de captura na expressão regular regex deve ser idêntico ao comprimento do vetor into. Caso contrário, ocorrerá um erro.
Você consegue resolver isso para que "3D" e um ou mais dígitos \\d+ sejam extraídos corretamente do data frame screens_per_movie?
Este exercício faz parte do curso
Expressões Regulares Intermediárias em R
Instruções do exercício
- Crie uma expressão regular
regexcom dois grupos de captura(). O conteúdo deles será extraído para as novas colunas. - Certifique-se de não remover a coluna de texto original.
- Garanta que o segundo grupo capturado seja convertido em números.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
extract(
screens_per_movie,
line,
into = c("is_3d", "screens"),
# Capture two groups: "3D" and "one or more digits"
regex = "___.*?___$",
# Pass TRUE or FALSE, the original column should not be removed
remove = ___,
# Pass TRUE or FALSE, the result should get converted to numbers
convert = ___
)