Compter par produit et réordonner
tidy_twitter a été tokenisé et les stop words, y compris les stop words personnalisés, ont été supprimés. Vous souhaitez visualiser les différences de comptage de mots selon qu’il s’agit de plaintes ou non.
Cet exercice fait partie du cours
Introduction à l’analyse de texte en R
Instructions
- Comptez les mots selon qu’il s’agit ou non d’une plainte.
- Conservez les 20 mots les plus fréquents selon qu’il s’agit ou non d’une plainte.
- Supprimez le groupement avant de réordonner
worden facteur par le nombre.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
word_counts <- tidy_twitter %>%
# Count words by whether or not its a complaint
___(___, ___) %>%
# Group by whether or not its a complaint
group_by(___) %>%
# Keep the top 20 words
___(___, ___) %>%
# Ungroup before reordering word as a factor by the count
___() %>%
___(word2 = ___(___, ___))