Praticando a sintaxe com grep
Você acabou de participar de uma dinâmica de integração no trabalho e registrou 10 fatos sobre seu chefe. Você salvou esses 10 fatos em um vetor chamado text. Usando expressões regulares, você quer resumir as respostas do seu chefe.
Algumas observações sobre expressões regulares em R:
- Ao usar
grep(), definirvalue = TRUEexibirá o texto em vez dos índices. - Você pode combinar padrões, como um dígito,
"\\d", seguido por um ponto"\\.", com"\\d\\." - Espaços podem ser encontrados usando
"\\s". - Você pode buscar uma palavra simplesmente usando a palavra como o padrão:
pattern = 'word'
Este exercício faz parte do curso
Introdução ao Processamento de Linguagem Natural em R
Instruções do exercício
- Usando
grep(), imprima o texto das respostas que contêm um número. - Encontre todos os itens com um número seguido por um espaço. Use uma expressão regular para o número e o espaço.
- Use
length()egrep()para descobrir quantas vezes você anotou a palavra"favorite".
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Print off each item that contained a numeric number
___(pattern = ___, x = text, value = TRUE)
# Find all items with a number followed by a space
___(pattern = ___, x = text)
# How many times did you write down 'favorite'?
length(___(pattern = ___, x = text))