Ein Korpus erstellen
Du hast ein Tibble namens russian_tweets erstellt, das etwa 20.000 Tweets enthält, die während des US-Wahlzyklus 2016 automatisch von Bots generiert wurden, damit du Textanalysen durchführen kannst. Bei der Suche nach geeigneten Möglichkeiten für deine geplante Analyse hältst du das Paket tm für den einfachsten Weg. Um die Analyse durchzuführen, musst du zuerst ein Korpus erstellen und potenziell nützliche Metadaten anhängen.
Achte darauf, dass es sich um echte Daten von Twitter handelt. Es besteht daher immer das Risiko, dass sie Obszönitäten oder andere anstößige Inhalte enthalten (in dieser Übung und in allen folgenden Übungen, die ebenfalls echte Twitter-Daten verwenden).
Diese Übung ist Teil des Kurses
Einführung in Natural Language Processing mit R
Anleitung zur Übung
- Erstelle ein Korpus anhand der Spalte
contentvonrussian_tweets. - Hänge die Spalten
followingundfollowersals Metadaten antweet_corpusan. - Gib die ersten Zeilen der Metadatentabelle aus.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Create a corpus
tweet_corpus <- ___(___(russian_tweets$___))
# Attach following and followers
___(tweet_corpus, 'following') <- russian_tweets$___
___(tweet_corpus, 'followers') <- russian_tweets$___
# Review the meta data
head(meta(___))