Eigene Stoppwörter hinzufügen
In twitter_data tauchen eine Reihe von Wörtern auf, die nicht informativ sind und aus deiner endgültigen Wortliste entfernt werden sollten. In dieser Übung fügst du deinem Data Frame custom_stop_words einige Wörter hinzu.
Diese Übung ist Teil des Kurses
Einführung in die Textanalyse mit R
Anleitung zur Übung
- Die Spaltennamen für den neuen Data Frame mit eigenen Stoppwörtern sollen mit
stop_wordsübereinstimmen. - Füge
http,winundt.coals eigene Stoppwörter hinzu. - Verbinde (row bind) die eigenen Stoppwörter mit
stop_words.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
custom_stop_words <- tribble(
# Column names should match stop_words
___, ___,
# Add http, win, and t.co as custom stop words
___, "CUSTOM",
___, "CUSTOM",
___, "CUSTOM"
)
# Bind the custom stop words to stop_words
stop_words2 <- stop_words %>%
___(___)