ComenzarEmpieza gratis

Usar el "patrón OR" con un conjunto de datos más grande

Ahora que has entendido el principio de concatenar múltiples posibilidades a partir de un vector, vamos un paso más allá y aplicamos esto a un conjunto de datos más grande. En el ámbito global hay dos variables disponibles: articles y politicians. La primera es una colección de artículos de prensa sobre la política suiza. La segunda es una lista de nombres de políticos suizos que aparecen en los artículos.

Tu tarea ahora es averiguar qué nombres aparecen en cuáles de los artículos y cuántas veces aparece cada político en todos los artículos.

Este ejercicio forma parte del curso

Expresiones regulares intermedias en R

Ver curso

Instrucciones del ejercicio

  • Usa el vector politicians para crear una expresión regular que coincida con todos los nombres almacenados en ese vector.
  • Crea una columna nueva en el data frame articles que contenga todos los nombres de políticos que aparecen en la columna text.
  • Une todos los artículos para que te resulte más fácil contar el número de apariciones por político.
  • Usa el vector politicians como patrón y pásalo a str_count().

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Construct a pattern that searches for all politicians
polit_pattern <- glue_collapse(___, sep = "___")

# Use the pattern to match all names in the column "text"
articles %<>%
  mutate(mentions = str_match_all(___, ___))

# Collapse all items of the column "text"
all_articles_in_one <- ___(articles$text)

# Pass the vector politicians to count all its elements
str_count(all_articles_in_one, ___)
Editar y ejecutar código