Tracer un meilleur nuage de mots
Maintenant que vous avez supprimé des mots vides supplémentaires, examinons le nuage de mots amélioré !
La matrice termes-documents de l’exercice précédent a été convertie en matrice avec as.matrix(), puis un vecteur nommé a été créé avec rowSums(). Ce nouvel objet de fréquences de termes appelé chardonnay_words est préchargé dans votre espace de travail. Voyons ces nouveaux résultats de nuage de mots.
Cet exercice fait partie du cours
Text mining avec sac de mots en R
Instructions
Nous avons chargé le package wordcloud pour vous en arrière-plan et nous le ferons pour tous les autres exercices qui en ont besoin.
- Triez les valeurs de
chardonnay_wordsavecdecreasing = TRUE. Enregistrez le résultat soussorted_chardonnay_words. - Affichez les 6 premiers mots dans
sorted_chardonnay_wordset leurs valeurs. - Créez
terms_vecen utilisantnames()surchardonnay_words. - Passez
terms_vecetchardonnay_wordsà la fonctionwordcloud(). Examinez quels autres mots ressortent maintenant que « chardonnay » est supprimé.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Sort the chardonnay_words in descending order
___ <- ___(___, ___)
# Print the 6 most frequent chardonnay terms
___(___)
# Get a terms vector
___ <- ___(___)
# Create a wordcloud for the values in word_freqs
wordcloud(___, ___,
max.words = 50, colors = "red")