IniziaInizia gratis

Visualizza le parole in comune

Ora che hai un corpus con le parole usate sia nei file di tweet su chardonnay sia in quelli sul caffè, puoi pulire il corpus, convertirlo in una TermDocumentMatrix e poi in una matrice per prepararlo a una commonality.cloud().

La funzione commonality.cloud() accetta questo oggetto matrice, oltre ad argomenti aggiuntivi come max.words e colors per personalizzare ulteriormente il grafico.

commonality.cloud(tdm_matrix, max.words = 100, colors = "springgreen")

Questo esercizio fa parte del corso

Text mining con Bag-of-Words in R

Visualizza il corso

Istruzioni dell'esercizio

  • Crea all_clean applicando la funzione predefinita clean_corpus() a all_corpus.
  • Crea all_tdm, una TermDocumentMatrix da all_clean.
  • Crea all_m convertendo all_tdm in un oggetto matrice.
  • Crea una commonality.cloud() da all_m con max.words = 100 e colors = "steelblue1".

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Clean the corpus
___ <- ___(___)

# Create all_tdm
___ <- ___(___)

# Create all_m
___ <- ___(___)

# Print a commonality cloud
___(___, ___, ___)
Modifica ed esegui il codice