Gemeinsame Wörter visualisieren
Jetzt, da du einen Korpus mit Wörtern aus beiden Dateien mit chardonnay- und coffee-Tweets hast, kannst du den Korpus bereinigen, ihn in eine TermDocumentMatrix und anschließend in eine Matrix umwandeln, um ihn für eine commonality.cloud() vorzubereiten.
Die Funktion commonality.cloud() akzeptiert dieses Matrix-Objekt sowie zusätzliche Argumente wie max.words und colors, um das Diagramm weiter anzupassen.
commonality.cloud(tdm_matrix, max.words = 100, colors = "springgreen")
Diese Übung ist Teil des Kurses
Text Mining mit Bag-of-Words in R
Anleitung zur Übung
- Erstelle
all_clean, indem du die vordefinierte Funktionclean_corpus()aufall_corpusanwendest. - Erstelle
all_tdm, eineTermDocumentMatrixausall_clean. - Erstelle
all_m, indem duall_tdmin ein Matrix-Objekt umwandelst. - Erstelle eine
commonality.cloud()ausall_mmitmax.words = 100undcolors = "steelblue1".
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Clean the corpus
___ <- ___(___)
# Create all_tdm
___ <- ___(___)
# Create all_m
___ <- ___(___)
# Print a commonality cloud
___(___, ___, ___)