Trova le parole in comune

Supponiamo che tu voglia visualizzare le parole comuni tra più documenti. Puoi farlo con commonality.cloud().

Ciascuno dei nostri corpora di coffee e chardonnay è composto da molti singoli tweet. Per trattare i tweet su coffee come un unico documento, e lo stesso per chardonnay, usa paste() per unire tutti i tweet in ciascun corpus insieme al parametro collapse = " ". Questo raggruppa tutti i tweet (separati da uno spazio) in un unico vettore. Poi puoi creare un unico vettore contenente i due documenti raggruppati.

a_single_string <- paste(a_character_vector, collapse = " ")

Una volta completati questi passaggi, puoi adottare lo stesso approccio visto in precedenza per creare un VCorpus() basato su un VectorSource dall’oggetto all_tweets.

Questo esercizio fa parte del corso

Text mining con Bag-of-Words in R

Visualizza corso

Istruzioni dell'esercizio

Crea all_coffee usando paste() con collapse = " " su coffee_tweets$text.
Crea all_chardonnay usando paste() con collapse = " " su chardonnay_tweets$text.
Crea all_tweets usando c() per combinare all_coffee e all_chardonnay. Metti all_coffee come primo termine.
Converti all_tweets usando VectorSource().
Crea all_corpus usando VCorpus() su all_tweets.

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

# Create all_coffee
___ <- ___(___, ___)

# Create all_chardonnay
___ <- ___(___, ___)

# Create all_tweets
___ <- ___(___, ___)

# Convert to a vector source
___ <- ___(___)

# Create all_corpus
___ <- ___(___)

Modifica ed esegui il codice