Vind gemeenschappelijke woorden
Stel dat je gemeenschappelijke woorden over meerdere documenten wilt visualiseren. Dat kan met commonality.cloud().
Elk van onze coffee- en chardonnay-corpora bestaat uit veel individuele tweets. Om de coffee-tweets als één document te behandelen, en hetzelfde voor chardonnay, plak je alle tweets in elk corpus aan elkaar met paste() en de parameter collapse = " ". Dit voegt alle tweets (gescheiden door een spatie) samen tot één vector. Vervolgens kun je een enkele vector maken die de twee samengevoegde documenten bevat.
a_single_string <- paste(a_character_vector, collapse = " ")
Als je deze stappen hebt afgerond, kun je dezelfde aanpak gebruiken als eerder om een VCorpus() te maken op basis van een VectorSource van het object all_tweets.
Deze oefening maakt deel uit van de cursus
Text mining met bag-of-words in R
Oefeninstructies
- Maak
all_coffeedoorpaste()metcollapse = " "toe te passen opcoffee_tweets$text. - Maak
all_chardonnaydoorpaste()metcollapse = " "toe te passen opchardonnay_tweets$text. - Maak
all_tweetsmetc()doorall_coffeeenall_chardonnayte combineren. Zetall_coffeeals eerste term. - Zet
all_tweetsom metVectorSource(). - Maak
all_corpusdoorVCorpus()te gebruiken opall_tweets.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Create all_coffee
___ <- ___(___, ___)
# Create all_chardonnay
___ <- ___(___, ___)
# Create all_tweets
___ <- ___(___, ___)
# Convert to a vector source
___ <- ___(___)
# Create all_corpus
___ <- ___(___)