Anticipo: clustering semplice di parole
Nel prossimo capitolo affronteremo alcuni argomenti vari (ma molto importanti) di text mining, tra cui:
- Pesatura TDM/DTM
- Gestione della sparsità in TDM/DTM
- Acquisizione dei metadati
- Clustering semplice delle parole per argomenti
- Analisi su più di una parola
Per ora, creiamo semplicemente un nuovo tipo di visualizzazione chiamato dendrogramma a partire dai nostri coffee_tweets. Il prossimo capitolo lo spiegherà in dettaglio.
Questo esercizio fa parte del corso
Text mining con Bag-of-Words in R
Istruzioni dell'esercizio
Un oggetto di clustering gerarchico, hc, è stato creato per te a partire dai tweet sul caffè.
Crea un dendrogramma usando plot() su hc.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Plot a dendrogram
___