Corresponder repetições
Certo, neste exercício seus padrões vão ficar bem mais poderosos. Agora você sabe como usar repetições para corresponder exatamente à quantidade desejada de dígitos ou letras.
Usando um número entre chaves {}, você pode definir quantas ocorrências quer buscar. Com um número, por exemplo {2}, você vai corresponder exatamente esse número de repetições. Com um número e uma vírgula, o número funciona como mínimo: {2,} (duas repetições ou mais). O segundo número define o máximo, então {2,4} significa entre 2 e 4 repetições.
O sinal de mais + e o asterisco * são uma forma ainda mais rápida de definir repetição: o primeiro corresponde a uma ou mais ocorrências e o segundo corresponde a zero, uma ou mais. Esses dois são frequentemente usados em combinação com o ponto . para corresponder a um número desconhecido de caracteres quaisquer.
Este exercício faz parte do curso
Expressões Regulares Intermediárias em R
Instruções do exercício
- Encontre todos os títulos que contenham um número com duas ou mais casas.
- Corresponda a primeira palavra de cada título buscando um ou mais caracteres de palavra no início da string.
- Corresponda a palavra
"Knight"e tudo o que vier antes dela.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# This lists all movies with two or more digits in a row
movie_titles[str_detect(
movie_titles,
pattern = "\\d{2,}"
)]
# List just the first words of every movie title
str_match(movie_titles, pattern = "___")
# Match everything that comes before "Knight"
str_match(movie_titles, pattern = "___Knight")