grepl e grep
Em sua forma mais básica, as expressões regulares podem ser usadas para verificar se um padrão existe em uma cadeia de caracteres ou em um vetor de cadeias de caracteres. Para esse fim, você pode usar:
grepl()
que retornaTRUE
quando um padrão é encontrado na cadeia de caracteres correspondente.grep()
que retorna um vetor de índices das cadeias de caracteres que contêm o padrão.
Ambas as funções precisam de um argumento pattern
e um x
, em que pattern
é a expressão regular que você deseja corresponder, e o argumento x
é o vetor de caracteres a partir do qual as correspondências devem ser buscadas.
Neste e nos próximos exercícios, você consultará e manipulará um vetor de caracteres de endereços de e-mail! O vetor emails
foi predefinido para que você possa começar a usar as instruções imediatamente!
Este exercício faz parte do curso
R intermediário
Instruções de exercício
- Use
grepl()
para gerar um vetor de lógicas que indica se esses endereços de e-mail contêm"edu"
. Imprima o resultado na saída. - Faça a mesma coisa com
grep()
mas, desta vez, salve os índices resultantes em uma variávelhits
. - Use a variável
hits
para selecionar no vetoremails
somente os e-mails que contêm"edu"
.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# The emails vector has already been defined for you
emails <- c("john.doe@ivyleague.edu", "education@world.gov", "dalai.lama@peace.org",
"invalid.edu", "quant@bigdatacollege.edu", "cookie.monster@sesame.tv")
# Use grepl() to match for "edu"
# Use grep() to match for "edu", save result to hits
# Subset emails using hits