Usar el "patrón OR" con un conjunto de datos más grande
Ahora que has entendido el principio de concatenar múltiples posibilidades a partir de un vector, vamos un paso más allá y aplicamos esto a un conjunto de datos más grande. En el ámbito global hay dos variables disponibles: articles y politicians. La primera es una colección de artículos de prensa sobre la política suiza. La segunda es una lista de nombres de políticos suizos que aparecen en los artículos.
Tu tarea ahora es averiguar qué nombres aparecen en cuáles de los artículos y cuántas veces aparece cada político en todos los artículos.
Este ejercicio forma parte del curso
Expresiones regulares intermedias en R
Instrucciones del ejercicio
- Usa el vector
politicianspara crear una expresión regular que coincida con todos los nombres almacenados en ese vector. - Crea una columna nueva en el data frame
articlesque contenga todos los nombres de políticos que aparecen en la columnatext. - Une todos los artículos para que te resulte más fácil contar el número de apariciones por político.
- Usa el vector
politicianscomo patrón y pásalo astr_count().
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Construct a pattern that searches for all politicians
polit_pattern <- glue_collapse(___, sep = "___")
# Use the pattern to match all names in the column "text"
articles %<>%
mutate(mentions = str_match_all(___, ___))
# Collapse all items of the column "text"
all_articles_in_one <- ___(articles$text)
# Pass the vector politicians to count all its elements
str_count(all_articles_in_one, ___)