Vind gemeenschappelijke woorden

Stel dat je gemeenschappelijke woorden over meerdere documenten wilt visualiseren. Dat kan met commonality.cloud().

Elk van onze coffee- en chardonnay-corpora bestaat uit veel individuele tweets. Om de coffee-tweets als één document te behandelen, en hetzelfde voor chardonnay, plak je alle tweets in elk corpus aan elkaar met paste() en de parameter collapse = " ". Dit voegt alle tweets (gescheiden door een spatie) samen tot één vector. Vervolgens kun je een enkele vector maken die de twee samengevoegde documenten bevat.

a_single_string <- paste(a_character_vector, collapse = " ")

Als je deze stappen hebt afgerond, kun je dezelfde aanpak gebruiken als eerder om een VCorpus() te maken op basis van een VectorSource van het object all_tweets.

Deze oefening maakt deel uit van de cursus

Text mining met bag-of-words in R

Bekijk cursus

Oefeninstructies

Maak all_coffee door paste() met collapse = " " toe te passen op coffee_tweets$text.
Maak all_chardonnay door paste() met collapse = " " toe te passen op chardonnay_tweets$text.
Maak all_tweets met c() door all_coffee en all_chardonnay te combineren. Zet all_coffee als eerste term.
Zet all_tweets om met VectorSource().
Maak all_corpus door VCorpus() te gebruiken op all_tweets.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Create all_coffee
___ <- ___(___, ___)

# Create all_chardonnay
___ <- ___(___, ___)

# Create all_tweets
___ <- ___(___, ___)

# Convert to a vector source
___ <- ___(___)

# Create all_corpus
___ <- ___(___)

Code bewerken en uitvoeren