Données de tweets sur les compagnies aériennes
Le data frame twitter_data contient plus de 7 000 tweets à propos de compagnies aériennes. Les tweets ont déjà été classés comme réclamations ou non-réclamations dans la colonne complaint_label. Voyons combien de ces tweets sont des réclamations.
Sachez qu’il s’agit de données réelles provenant de Twitter et qu’il existe donc un risque qu’elles contiennent des grossièretés ou d’autres contenus offensants (dans cet exercice, et dans tout exercice ultérieur utilisant également des données réelles de Twitter).
Cet exercice fait partie du cours
Introduction à l’analyse de texte en R
Instructions
- Chargez le package
tidyverse. - Obtenez un aperçu de la taille et du contenu des données en affichant
twitter_data. - Filtrez
twitter_datapour ne conserver que les réclamations. Combien de réclamations y a-t-il dans les données ?
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Load the tidyverse packages
___(___)
# Print twitter_data
___
# Print just the complaints in twitter_data
twitter_data %>%
___(___ == ___)