Usare l'"or pattern" con un dataset più grande
Ora che hai capito il principio di concatenare più possibilità a partire da un vettore, fai un passo avanti e applicalo a un dataset più grande. Nello scope globale sono disponibili due variabili: articles e politicians. La prima è una raccolta di articoli di cronaca sulla politica svizzera. La seconda è un elenco di nomi di politici svizzeri che compaiono negli articoli.
Ora tocca a te scoprire quali nomi compaiono in quali articoli e quante volte compare ciascun politico in tutti gli articoli.
Questo esercizio fa parte del corso
Espressioni regolari intermedie in R
Istruzioni dell'esercizio
- Usa il vettore
politiciansper creare un'espressione regolare che corrisponda a tutti i nomi contenuti in quel vettore. - Crea una nuova colonna nel data frame
articlesche contenga tutti i nomi dei politici che compaiono nella colonnatext. - Unisci tutti gli articoli così da poter contare più facilmente il numero di occorrenze per politico.
- Usa il vettore
politicianscome pattern e passalo astr_count().
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Construct a pattern that searches for all politicians
polit_pattern <- glue_collapse(___, sep = "___")
# Use the pattern to match all names in the column "text"
articles %<>%
mutate(mentions = str_match_all(___, ___))
# Collapse all items of the column "text"
all_articles_in_one <- ___(articles$text)
# Pass the vector politicians to count all its elements
str_count(all_articles_in_one, ___)