CommencerCommencer gratuitement

Visualiser les mots communs

Maintenant que vous avez un corpus rempli de mots présents à la fois dans les fichiers de tweets sur le chardonnay et le café, vous pouvez nettoyer le corpus, le convertir en TermDocumentMatrix, puis en matrice pour le préparer à un commonality.cloud().

La fonction commonality.cloud() accepte cet objet matrice, ainsi que des arguments supplémentaires comme max.words et colors pour personnaliser davantage le graphique.

commonality.cloud(tdm_matrix, max.words = 100, colors = "springgreen")

Cet exercice fait partie du cours

Text mining avec sac de mots en R

Afficher le cours

Instructions

  • Créez all_clean en appliquant la fonction prédéfinie clean_corpus() à all_corpus.
  • Créez all_tdm, un TermDocumentMatrix à partir de all_clean.
  • Créez all_m en convertissant all_tdm en un objet matrice.
  • Créez un commonality.cloud() à partir de all_m avec max.words = 100 et colors = "steelblue1".

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Clean the corpus
___ <- ___(___)

# Create all_tdm
___ <- ___(___)

# Create all_m
___ <- ___(___)

# Print a commonality cloud
___(___, ___, ___)
Modifier et exécuter le code