Visualiser les mots communs
Maintenant que vous avez un corpus rempli de mots présents à la fois dans les fichiers de tweets sur le chardonnay et le café, vous pouvez nettoyer le corpus, le convertir en TermDocumentMatrix, puis en matrice pour le préparer à un commonality.cloud().
La fonction commonality.cloud() accepte cet objet matrice, ainsi que des arguments supplémentaires comme max.words et colors pour personnaliser davantage le graphique.
commonality.cloud(tdm_matrix, max.words = 100, colors = "springgreen")
Cet exercice fait partie du cours
Text mining avec sac de mots en R
Instructions
- Créez
all_cleanen appliquant la fonction prédéfinieclean_corpus()àall_corpus. - Créez
all_tdm, unTermDocumentMatrixà partir deall_clean. - Créez
all_men convertissantall_tdmen un objet matrice. - Créez un
commonality.cloud()à partir deall_mavecmax.words = 100etcolors = "steelblue1".
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Clean the corpus
___ <- ___(___)
# Create all_tdm
___ <- ___(___)
# Create all_m
___ <- ___(___)
# Print a commonality cloud
___(___, ___, ___)