Revue rapide des avis sur Google
Vous décidez de créer un comparison.cloud() des avis positifs et négatifs sur Google afin de le comparer à Amazon. Cela vous donnera rapidement une vision des termes principaux, sans passer autant de temps que pour l’analyse des avis Amazon dans les exercices précédents.
Nous mettons à votre disposition un corpus all_goog_corpus, qui contient 500 avis positifs et 500 avis négatifs sur Google. Ici, vous allez nettoyer le corpus et créer un nuage comparatif mettant en regard les mots fréquents dans les avis « pour » et « contre ».
Cet exercice fait partie du cours
Text mining avec sac de mots en R
Instructions
L’objet all_goog_corpus, composé des avis « pour » et « contre » sur Google, est chargé dans votre espace de travail.
- Créez
all_goog_corpen nettoyantall_goog_corpusavec la fonction prédéfinietm_clean(). - Créez
all_tdmen convertissantall_goog_corpen matrice termes-documents. - Créez
all_men convertissantall_tdmen matrice. - Construisez un
comparison.cloud()à partir deall_m. Fixezmax.wordsà100. L’argumentcolorsest déjà spécifié pour vous.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Create all_goog_corp
___ <- ___
# Create all_tdm
___ <- ___
# Create all_m
___ <- ___
# Build a comparison cloud
___(___,
max.words = ___,
colors = c("#F44336", "#2196f3"))