Gemeinsame Wörter finden

Angenommen, du möchtest gemeinsame Wörter über mehrere Dokumente hinweg visualisieren. Das geht mit commonality.cloud().

Jedes unserer Coffee- und Chardonnay-Korpora besteht aus vielen einzelnen Tweets. Um die Coffee-Tweets als ein einzelnes Dokument zu behandeln – und entsprechend auch die Chardonnay-Tweets –, fügst du alle Tweets in jedem Korpus mit paste() und dem Parameter collapse = " " zusammen. Dadurch werden alle Tweets (durch ein Leerzeichen getrennt) zu einem einzelnen Vektor zusammengeführt. Anschließend kannst du einen einzelnen Vektor erstellen, der die beiden zusammengefassten Dokumente enthält.

a_single_string <- paste(a_character_vector, collapse = " ")

Wenn du diese Schritte abgeschlossen hast, kannst du wie zuvor vorgehen und ein VCorpus() auf Basis einer VectorSource aus dem Objekt all_tweets erstellen.

Diese Übung ist Teil des Kurses

<Kurs>Text Mining mit Bag-of-Words in R</Kurs>

Kurs ansehen

Übungsanweisungen

Erstelle all_coffee, indem du paste() mit collapse = " " auf coffee_tweets$text anwendest.
Erstelle all_chardonnay, indem du paste() mit collapse = " " auf chardonnay_tweets$text anwendest.
Erstelle all_tweets, indem du c() verwendest, um all_coffee und all_chardonnay zu kombinieren. Setze all_coffee an die erste Stelle.
Wandle all_tweets mit VectorSource() um.
Erstelle all_corpus, indem du VCorpus() auf all_tweets anwendest.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Create all_coffee
___ <- ___(___, ___)

# Create all_chardonnay
___ <- ___(___, ___)

# Create all_tweets
___ <- ___(___, ___)

# Convert to a vector source
___ <- ___(___)

# Create all_corpus
___ <- ___(___)

Code bearbeiten und ausführen