grepl e grep

Em sua forma mais básica, as expressões regulares podem ser usadas para verificar se um padrão existe em uma cadeia de caracteres ou em um vetor de cadeias de caracteres. Para esse fim, você pode usar:

  • grepl()que retorna TRUE quando um padrão é encontrado na cadeia de caracteres correspondente.
  • grep()que retorna um vetor de índices das cadeias de caracteres que contêm o padrão.

Ambas as funções precisam de um argumento pattern e um x, em que pattern é a expressão regular que você deseja corresponder, e o argumento x é o vetor de caracteres a partir do qual as correspondências devem ser buscadas.

Neste e nos próximos exercícios, você consultará e manipulará um vetor de caracteres de endereços de e-mail! O vetor emails foi predefinido para que você possa começar a usar as instruções imediatamente!

Este exercício faz parte do curso

R intermediário

Ver Curso

Instruções de exercício

  • Use grepl() para gerar um vetor de lógicas que indica se esses endereços de e-mail contêm "edu". Imprima o resultado na saída.
  • Faça a mesma coisa com grep() mas, desta vez, salve os índices resultantes em uma variável hits.
  • Use a variável hits para selecionar no vetor emails somente os e-mails que contêm "edu".

Exercício interativo prático

Experimente este exercício preenchendo este código de exemplo.

# The emails vector has already been defined for you
emails <- c("john.doe@ivyleague.edu", "education@world.gov", "dalai.lama@peace.org",
            "invalid.edu", "quant@bigdatacollege.edu", "cookie.monster@sesame.tv")

# Use grepl() to match for "edu"


# Use grep() to match for "edu", save result to hits


# Subset emails using hits