Gemeinsame Wörter finden
Angenommen, du möchtest gemeinsame Wörter über mehrere Dokumente hinweg visualisieren. Das geht mit commonality.cloud().
Jedes unserer Coffee- und Chardonnay-Korpora besteht aus vielen einzelnen Tweets. Um die Coffee-Tweets als ein einzelnes Dokument zu behandeln – und entsprechend auch die Chardonnay-Tweets –, fügst du alle Tweets in jedem Korpus mit paste() und dem Parameter collapse = " " zusammen. Dadurch werden alle Tweets (durch ein Leerzeichen getrennt) zu einem einzelnen Vektor zusammengeführt. Anschließend kannst du einen einzelnen Vektor erstellen, der die beiden zusammengefassten Dokumente enthält.
a_single_string <- paste(a_character_vector, collapse = " ")
Wenn du diese Schritte abgeschlossen hast, kannst du wie zuvor vorgehen und ein VCorpus() auf Basis einer VectorSource aus dem Objekt all_tweets erstellen.
Diese Übung ist Teil des Kurses
Text Mining mit Bag-of-Words in R
Anleitung zur Übung
- Erstelle
all_coffee, indem dupaste()mitcollapse = " "aufcoffee_tweets$textanwendest. - Erstelle
all_chardonnay, indem dupaste()mitcollapse = " "aufchardonnay_tweets$textanwendest. - Erstelle
all_tweets, indem duc()verwendest, umall_coffeeundall_chardonnayzu kombinieren. Setzeall_coffeean die erste Stelle. - Wandle
all_tweetsmitVectorSource()um. - Erstelle
all_corpus, indem duVCorpus()aufall_tweetsanwendest.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Create all_coffee
___ <- ___(___, ___)
# Create all_chardonnay
___ <- ___(___, ___)
# Create all_tweets
___ <- ___(___, ___)
# Convert to a vector source
___ <- ___(___)
# Create all_corpus
___ <- ___(___)