CommencerCommencez gratuitement

Compter par produit et réordonner

tidy_twitter a été tokenisé et les stop words, y compris les stop words personnalisés, ont été supprimés. Vous souhaitez visualiser les différences de comptage de mots selon qu’il s’agit de plaintes ou non.

Cet exercice fait partie du cours

<cours>Introduction à l’analyse de texte en R</cours>
Voir le cours

Instructions de l’exercice

  • Comptez les mots selon qu’il s’agit ou non d’une plainte.
  • Conservez les 20 mots les plus fréquents selon qu’il s’agit ou non d’une plainte.
  • Supprimez le groupement avant de réordonner word en facteur par le nombre.

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

word_counts <- tidy_twitter %>%
  # Count words by whether or not its a complaint
  ___(___, ___) %>%
  # Group by whether or not its a complaint
  group_by(___) %>%
  # Keep the top 20 words
  ___(___, ___) %>%
  # Ungroup before reordering word as a factor by the count
  ___() %>%
  ___(word2 = ___(___, ___))
Modifier et exécuter le code