Contando por produto e reordenando
tidy_twitter já foi tokenizado e as stop words, incluindo stop words personalizadas, foram removidas. Você quer visualizar as diferenças nas contagens de palavras entre reclamações e não reclamações.
Este exercício faz parte do curso
Introdução à Análise de Texto em R
Instruções do exercício
- Conte as palavras considerando se é ou não uma reclamação.
- Mantenha as 20 palavras mais frequentes considerando se é ou não uma reclamação.
- Remova o agrupamento antes de reordenar
wordcomo fator pela contagem.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
word_counts <- tidy_twitter %>%
# Count words by whether or not its a complaint
___(___, ___) %>%
# Group by whether or not its a complaint
group_by(___) %>%
# Keep the top 20 words
___(___, ___) %>%
# Ungroup before reordering word as a factor by the count
___() %>%
___(word2 = ___(___, ___))