Adelanto: agrupación simple de palabras
En el próximo capítulo veremos algunos temas variados (pero muy importantes) de minería de texto, entre ellos:
- Ponderación de TDM/DTM
- Cómo gestionar la dispersión (sparsity) en TDM/DTM
- Captura de metadatos
- Agrupación simple de palabras por temas
- Análisis de más de una palabra
Por ahora, vamos a crear un nuevo visual llamado dendrograma a partir de nuestros coffee_tweets. El próximo capítulo lo explicará en detalle.
Este ejercicio forma parte del curso
Minería de texto con Bag-of-Words en R
Instrucciones del ejercicio
Ya tienes creado un objeto de clustering jerárquico, hc, a partir de los tweets sobre café.
Crea un dendrograma usando plot() sobre hc.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Plot a dendrogram
___