Duel en cage, partie 2 ! Avis négatifs

Dans les deux organisations, les gens mentionnent la « culture » et les « personnes brillantes », ce qui montre certains points positifs communs entre les deux entreprises. Cependant, avec le graphique pyramidal, vous pouvez commencer à inférer le niveau d’intensité de ces aspects positifs des environnements de travail.

Vous décidez maintenant de vous concentrer sur les avis négatifs et de réaliser la même visualisation. Cette fois, vous avez déjà le data frame common_words dans votre espace de travail. Toutefois, les bigrammes communs de cet exercice proviennent d’avis d’employés négatifs.

Cet exercice fait partie du cours

Text mining avec sac de mots en R

Afficher le cours

Instructions

En utilisant slice_max() sur common_words, obtenez les 5 meilleurs bigrammes en vous référant à la colonne diff. Les résultats du nouvel objet s’afficheront dans votre console.
Créez un pyramid.plot(). Passez top5_df$AmazonNeg, top5_df$GoogleNeg, et labels = top5_df$terms. Pour un meilleur étiquetage, définissez :
- gap à 12.
- top.labels à c("Amzn", "Neg Words", "Goog")

Les arguments main et unit sont déjà définis pour vous.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Extract top 5 common bigrams
(top5_df <- ___ %>% ___(___, n = ___))

# Create a pyramid plot
___(
    # Amazon on the left
    top5_df$___,
    # Google on the right
    top5_df$___,
    # Use terms for labels
    labels = top5_df$___,
    # Set the gap to 12
    ___ = ___,
    # Set top.labels to "Amzn", "Neg Words" & "Goog"
    ___ = ___,
    main = "Words in Common", 
    unit = NULL
)

Modifier et exécuter le code