Usando o "padrão OU" com um conjunto de dados maior
Agora que você entendeu o princípio de concatenar múltiplas possibilidades a partir de um vetor, vai dar um passo adiante e aplicar isso a um conjunto de dados maior. Estão disponíveis no escopo global duas variáveis: articles e politicians. A primeira é uma coleção de artigos de notícia sobre a política suíça. A segunda é uma lista com nomes de políticos suíços que aparecem nos artigos.
Agora é seu trabalho descobrir quais nomes aparecem em quais artigos e quantas vezes cada político aparece em todos os artigos.
Este exercício faz parte do curso
Expressões Regulares Intermediárias em R
Instruções do exercício
- Use o vetor
politicianspara criar uma expressão regular que corresponda a todos os nomes armazenados nesse vetor. - Crie uma nova coluna no data frame
articlesque contenha todos os nomes de políticos que aparecem na colunatext. - Una todos os artigos para facilitar a contagem do número de ocorrências por político.
- Use o vetor
politicianscomo padrão e passe-o parastr_count().
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Construct a pattern that searches for all politicians
polit_pattern <- glue_collapse(___, sep = "___")
# Use the pattern to match all names in the column "text"
articles %<>%
mutate(mentions = str_match_all(___, ___))
# Collapse all items of the column "text"
all_articles_in_one <- ___(articles$text)
# Pass the vector politicians to count all its elements
str_count(all_articles_in_one, ___)