Avant-goût : regroupement simple de mots
Dans le prochain chapitre, nous aborderons divers sujets (très importants) de fouille de textes, notamment :
- Pondération TDM/DTM
- Gestion de la sparsité des TDM/DTM
- Capture des métadonnées
- Regroupement simple de mots par thématiques
- Analyse au-delà d'un seul mot
Pour l'instant, créons simplement un nouveau visuel appelé un dendrogramme à partir de nos coffee_tweets. Le prochain chapitre l'expliquera en détail.
Cet exercice fait partie du cours
Text mining avec sac de mots en R
Instructions
Un objet de classification hiérarchique, hc, a été créé pour vous à partir des tweets sur le café.
Créez un dendrogramme en utilisant plot() sur hc.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Plot a dendrogram
___