ComeçarComece de graça

Usando o "padrão OU" com um conjunto de dados maior

Agora que você entendeu o princípio de concatenar múltiplas possibilidades a partir de um vetor, vai dar um passo adiante e aplicar isso a um conjunto de dados maior. Estão disponíveis no escopo global duas variáveis: articles e politicians. A primeira é uma coleção de artigos de notícia sobre a política suíça. A segunda é uma lista com nomes de políticos suíços que aparecem nos artigos.

Agora é seu trabalho descobrir quais nomes aparecem em quais artigos e quantas vezes cada político aparece em todos os artigos.

Este exercício faz parte do curso

Expressões Regulares Intermediárias em R

Ver curso

Instruções do exercício

  • Use o vetor politicians para criar uma expressão regular que corresponda a todos os nomes armazenados nesse vetor.
  • Crie uma nova coluna no data frame articles que contenha todos os nomes de políticos que aparecem na coluna text.
  • Una todos os artigos para facilitar a contagem do número de ocorrências por político.
  • Use o vetor politicians como padrão e passe-o para str_count().

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Construct a pattern that searches for all politicians
polit_pattern <- glue_collapse(___, sep = "___")

# Use the pattern to match all names in the column "text"
articles %<>%
  mutate(mentions = str_match_all(___, ___))

# Collapse all items of the column "text"
all_articles_in_one <- ___(articles$text)

# Pass the vector politicians to count all its elements
str_count(all_articles_in_one, ___)
Editar e executar o código