LoslegenKostenlos loslegen

Gemeinsame Wörter visualisieren

Jetzt, da du einen Korpus mit Wörtern aus beiden Dateien mit chardonnay- und coffee-Tweets hast, kannst du den Korpus bereinigen, ihn in eine TermDocumentMatrix und anschließend in eine Matrix umwandeln, um ihn für eine commonality.cloud() vorzubereiten.

Die Funktion commonality.cloud() akzeptiert dieses Matrix-Objekt sowie zusätzliche Argumente wie max.words und colors, um das Diagramm weiter anzupassen.

commonality.cloud(tdm_matrix, max.words = 100, colors = "springgreen")

Diese Übung ist Teil des Kurses

Text Mining mit Bag-of-Words in R

Kurs anzeigen

Anleitung zur Übung

  • Erstelle all_clean, indem du die vordefinierte Funktion clean_corpus() auf all_corpus anwendest.
  • Erstelle all_tdm, eine TermDocumentMatrix aus all_clean.
  • Erstelle all_m, indem du all_tdm in ein Matrix-Objekt umwandelst.
  • Erstelle eine commonality.cloud() aus all_m mit max.words = 100 und colors = "steelblue1".

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Clean the corpus
___ <- ___(___)

# Create all_tdm
___ <- ___(___)

# Create all_m
___ <- ___(___)

# Print a commonality cloud
___(___, ___, ___)
Code bearbeiten und ausführen