Trova le parole in comune
Supponiamo che tu voglia visualizzare le parole comuni tra più documenti. Puoi farlo con commonality.cloud().
Ciascuno dei nostri corpora di coffee e chardonnay è composto da molti singoli tweet. Per trattare i tweet su coffee come un unico documento, e lo stesso per chardonnay, usa paste() per unire tutti i tweet in ciascun corpus insieme al parametro collapse = " ". Questo raggruppa tutti i tweet (separati da uno spazio) in un unico vettore. Poi puoi creare un unico vettore contenente i due documenti raggruppati.
a_single_string <- paste(a_character_vector, collapse = " ")
Una volta completati questi passaggi, puoi adottare lo stesso approccio visto in precedenza per creare un VCorpus() basato su un VectorSource dall’oggetto all_tweets.
Questo esercizio fa parte del corso
Text mining con Bag-of-Words in R
Istruzioni dell'esercizio
- Crea
all_coffeeusandopaste()concollapse = " "sucoffee_tweets$text. - Crea
all_chardonnayusandopaste()concollapse = " "suchardonnay_tweets$text. - Crea
all_tweetsusandoc()per combinareall_coffeeeall_chardonnay. Mettiall_coffeecome primo termine. - Converti
all_tweetsusandoVectorSource(). - Crea
all_corpususandoVCorpus()suall_tweets.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Create all_coffee
___ <- ___(___, ___)
# Create all_chardonnay
___ <- ___(___, ___)
# Create all_tweets
___ <- ___(___, ___)
# Convert to a vector source
___ <- ___(___)
# Create all_corpus
___ <- ___(___)