Compter par produit et réordonner
tidy_twitter a été tokenisé et les stop words, y compris les stop words personnalisés, ont été supprimés. Vous souhaitez visualiser les différences de comptage de mots selon qu’il s’agit de plaintes ou non.
Cet exercice fait partie du cours
<cours>Introduction à l’analyse de texte en R</cours>Instructions de l’exercice
- Comptez les mots selon qu’il s’agit ou non d’une plainte.
- Conservez les 20 mots les plus fréquents selon qu’il s’agit ou non d’une plainte.
- Supprimez le groupement avant de réordonner
worden facteur par le nombre.
Exercice interactif pratique
Essayez cet exercice en complétant ce code d’exemple.
word_counts <- tidy_twitter %>%
# Count words by whether or not its a complaint
___(___, ___) %>%
# Group by whether or not its a complaint
group_by(___) %>%
# Keep the top 20 words
___(___, ___) %>%
# Ungroup before reordering word as a factor by the count
___() %>%
___(word2 = ___(___, ___))