Données de tweets sur les compagnies aériennes

Le data frame twitter_data contient plus de 7 000 tweets à propos de compagnies aériennes. Les tweets ont déjà été classés comme réclamations ou non-réclamations dans la colonne complaint_label. Voyons combien de ces tweets sont des réclamations.

Sachez qu’il s’agit de données réelles provenant de Twitter et qu’il existe donc un risque qu’elles contiennent des grossièretés ou d’autres contenus offensants (dans cet exercice, et dans tout exercice ultérieur utilisant également des données réelles de Twitter).

Cet exercice fait partie du cours

Introduction à l’analyse de texte en R

Afficher le cours

Instructions

Chargez le package tidyverse.
Obtenez un aperçu de la taille et du contenu des données en affichant twitter_data.
Filtrez twitter_data pour ne conserver que les réclamations. Combien de réclamations y a-t-il dans les données ?

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Load the tidyverse packages
___(___)

# Print twitter_data
___

# Print just the complaints in twitter_data
twitter_data %>% 
  ___(___ == ___)

Modifier et exécuter le code