IniziaInizia gratis

Usare l'"or pattern" con un dataset più grande

Ora che hai capito il principio di concatenare più possibilità a partire da un vettore, fai un passo avanti e applicalo a un dataset più grande. Nello scope globale sono disponibili due variabili: articles e politicians. La prima è una raccolta di articoli di cronaca sulla politica svizzera. La seconda è un elenco di nomi di politici svizzeri che compaiono negli articoli.

Ora tocca a te scoprire quali nomi compaiono in quali articoli e quante volte compare ciascun politico in tutti gli articoli.

Questo esercizio fa parte del corso

Espressioni regolari intermedie in R

Visualizza il corso

Istruzioni dell'esercizio

  • Usa il vettore politicians per creare un'espressione regolare che corrisponda a tutti i nomi contenuti in quel vettore.
  • Crea una nuova colonna nel data frame articles che contenga tutti i nomi dei politici che compaiono nella colonna text.
  • Unisci tutti gli articoli così da poter contare più facilmente il numero di occorrenze per politico.
  • Usa il vettore politicians come pattern e passalo a str_count().

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Construct a pattern that searches for all politicians
polit_pattern <- glue_collapse(___, sep = "___")

# Use the pattern to match all names in the column "text"
articles %<>%
  mutate(mentions = str_match_all(___, ___))

# Collapse all items of the column "text"
all_articles_in_one <- ___(articles$text)

# Pass the vector politicians to count all its elements
str_count(all_articles_in_one, ___)
Modifica ed esegui il codice