ComenzarEmpieza gratis

grepl y grep (2)

Puedes utilizar el caret, ^, y el signo de dólar, $, para aplicar coincidencia al contenido situado al principio y al final de una cadena, respectivamente. Esto podría acercarnos un paso más a un patrón correcto para aplicar coincidencia solo a las direcciones de correo ".edu" de nuestra lista. Sin embargo, podemos añadir más cosas para que el patrón sea más robusto:

  • @, porque una dirección de correo electrónico válida debe contener ese signo.
  • .*, que aplica coincidencia a cualquier carácter (.) cero o más veces (*). Tanto el punto como el asterisco son metacaracteres. Puedes utilizarlos para aplicar coincidencia a cualquier carácter entre el signo arroba y la parte ".edu" de una dirección de correo electrónico.
  • \\.edu$, para aplicar coincidencia a la parte ".edu" de la dirección de correo electrónico del final de la cadena. La parte \\ es el carácter de escape del punto: le indica a R que quieres utilizar . como carácter real.

Este ejercicio forma parte del curso

R intermedio

Ver curso

Instrucciones del ejercicio

  • Utiliza grepl() con la expresión regular más avanzada para devolver un vector lógico. Simplemente imprime el resultado.
  • Haz algo similar con grep() para crear un vector de índices. Guarda el resultado en la variable hits.
  • Utiliza de nuevo emails[hits] para subdividir el vector emails.

Ejercicio interactivo práctico

Prueba este ejercicio completando el código de muestra.

# The emails vector has already been defined for you
emails <- c("[email protected]", "[email protected]", "[email protected]",
            "invalid.edu", "[email protected]", "[email protected]")

# Use grepl() to match for .edu addresses more robustly


# Use grep() to match for .edu addresses more robustly, save result to hits


# Subset emails using hits
Editar y ejecutar código