LoslegenKostenlos loslegen

Gemeinsame Wörter finden

Angenommen, du möchtest gemeinsame Wörter über mehrere Dokumente hinweg visualisieren. Das geht mit commonality.cloud().

Jedes unserer Coffee- und Chardonnay-Korpora besteht aus vielen einzelnen Tweets. Um die Coffee-Tweets als ein einzelnes Dokument zu behandeln – und entsprechend auch die Chardonnay-Tweets –, fügst du alle Tweets in jedem Korpus mit paste() und dem Parameter collapse = " " zusammen. Dadurch werden alle Tweets (durch ein Leerzeichen getrennt) zu einem einzelnen Vektor zusammengeführt. Anschließend kannst du einen einzelnen Vektor erstellen, der die beiden zusammengefassten Dokumente enthält.

a_single_string <- paste(a_character_vector, collapse = " ")

Wenn du diese Schritte abgeschlossen hast, kannst du wie zuvor vorgehen und ein VCorpus() auf Basis einer VectorSource aus dem Objekt all_tweets erstellen.

Diese Übung ist Teil des Kurses

Text Mining mit Bag-of-Words in R

Kurs anzeigen

Anleitung zur Übung

  • Erstelle all_coffee, indem du paste() mit collapse = " " auf coffee_tweets$text anwendest.
  • Erstelle all_chardonnay, indem du paste() mit collapse = " " auf chardonnay_tweets$text anwendest.
  • Erstelle all_tweets, indem du c() verwendest, um all_coffee und all_chardonnay zu kombinieren. Setze all_coffee an die erste Stelle.
  • Wandle all_tweets mit VectorSource() um.
  • Erstelle all_corpus, indem du VCorpus() auf all_tweets anwendest.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Create all_coffee
___ <- ___(___, ___)

# Create all_chardonnay
___ <- ___(___, ___)

# Create all_tweets
___ <- ___(___, ___)

# Convert to a vector source
___ <- ___(___)

# Create all_corpus
___ <- ___(___)
Code bearbeiten und ausführen