Contando por produto e reordenando
tidy_twitter já foi tokenizado e as stop words, incluindo stop words personalizadas, foram removidas. Você quer visualizar as diferenças nas contagens de palavras entre reclamações e não reclamações.
Este exercicio faz parte do curso
Introdução à Análise de Texto em R
Instruções do exercicio
- Conte as palavras considerando se é ou não uma reclamação.
- Mantenha as 20 palavras mais frequentes considerando se é ou não uma reclamação.
- Remova o agrupamento antes de reordenar
wordcomo fator pela contagem.
exercicio interativo prático
Tente este exercicio completando este código de exemplo.
word_counts <- tidy_twitter %>%
# Count words by whether or not its a complaint
___(___, ___) %>%
# Group by whether or not its a complaint
group_by(___) %>%
# Keep the top 20 words
___(___, ___) %>%
# Ungroup before reordering word as a factor by the count
___() %>%
___(word2 = ___(___, ___))