CommencerCommencer gratuitement

Revue rapide des avis sur Google

Vous décidez de créer un comparison.cloud() des avis positifs et négatifs sur Google afin de le comparer à Amazon. Cela vous donnera rapidement une vision des termes principaux, sans passer autant de temps que pour l’analyse des avis Amazon dans les exercices précédents.

Nous mettons à votre disposition un corpus all_goog_corpus, qui contient 500 avis positifs et 500 avis négatifs sur Google. Ici, vous allez nettoyer le corpus et créer un nuage comparatif mettant en regard les mots fréquents dans les avis « pour » et « contre ».

Cet exercice fait partie du cours

Text mining avec sac de mots en R

Afficher le cours

Instructions

L’objet all_goog_corpus, composé des avis « pour » et « contre » sur Google, est chargé dans votre espace de travail.

  • Créez all_goog_corp en nettoyant all_goog_corpus avec la fonction prédéfinie tm_clean().
  • Créez all_tdm en convertissant all_goog_corp en matrice termes-documents.
  • Créez all_m en convertissant all_tdm en matrice.
  • Construisez un comparison.cloud() à partir de all_m. Fixez max.words à 100. L’argument colors est déjà spécifié pour vous.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Create all_goog_corp
___ <- ___

# Create all_tdm
___ <- ___

# Create all_m
___ <- ___

# Build a comparison cloud
___(___, 
    max.words = ___, 
    colors = c("#F44336", "#2196f3"))
Modifier et exécuter le code