Una semplice word cloud
A questo punto hai bevuto troppo caffè. Inoltre, vedere parole in cima come "shop", "morning" e "drinking", tra le altre, non è poi così illuminante.
Per festeggiare di essere arrivato fin qui, proviamo con un altro gruppo di 1000 tweet. Per ora non saprai cosa hanno in comune, ma vediamo se riesci a capirlo usando una word cloud. I valori di frequenza dei termini dei tweet sono già caricati nel tuo workspace.
Una word cloud è una visualizzazione dei termini. In una word cloud, la dimensione è spesso proporzionata alla frequenza e, in alcuni casi, i colori possono indicare un'altra metrica. Per ora, manteniamo le cose semplici: la dimensione è legata alla frequenza delle singole parole e scegliamo un solo colore.
Come hai visto nel video, la funzione wordcloud() funziona così:
wordcloud(words, frequencies, max.words = 500, colors = "blue")
Nelle analisi di text mining compaiono spesso semplici word cloud. In effetti, probabilmente sono usate fin troppo, ma possono comunque essere utili per capire rapidamente un insieme di testi!
term_frequency è già caricato nel tuo workspace.
Questo esercizio fa parte del corso
Text mining con Bag-of-Words in R
Istruzioni dell'esercizio
- Carica il pacchetto
wordcloud. - Stampa le prime 10 voci di
term_frequency. - Estrai i termini usando
names()suterm_frequency. Chiama il vettore di stringheterms_vec. - Crea una
wordcloud()usandoterms_veccome parole eterm_frequencycome valori. Aggiungi i parametrimax.words = 50ecolors = "red".
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Load wordcloud package
# Print the first 10 entries in term_frequency
# Vector of terms
# Create a word cloud for the values in word_freqs