Teaser: agrupamento simples de palavras
No próximo capítulo, vamos abordar alguns temas variados (e muito importantes) de mineração de texto, incluindo:
- ponderação em TDM/DTM
- como lidar com a esparsidade de TDM/DTM
- captura de metadados
- agrupamento simples de palavras por tópicos
- análise com mais de uma palavra
Por agora, vamos apenas criar um novo visual chamado dendrograma a partir dos nossos coffee_tweets. O próximo capítulo vai explicar isso em detalhes.
Este exercício faz parte do curso
Mineração de Texto com Bag-of-Words em R
Instruções do exercício
Um objeto de cluster hierárquico, hc, foi criado para você a partir dos tweets sobre café.
Crie um dendrograma usando plot() em hc.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Plot a dendrogram
___