Ein Korpus erstellen
Du hast ein Tibble namens russian_tweets erstellt, das etwa 20.000 Tweets enthält, die während des US-Wahlzyklus 2016 automatisch von Bots generiert wurden, damit du Textanalysen durchführen kannst. Bei der Suche nach geeigneten Möglichkeiten für deine geplante Analyse hältst du das Paket tm für den einfachsten Weg. Um die Analyse durchzuführen, musst du zuerst ein Korpus erstellen und potenziell nützliche Metadaten anhängen.
Achte darauf, dass es sich um echte Daten von Twitter handelt. Es besteht daher immer das Risiko, dass sie Obszönitäten oder andere anstößige Inhalte enthalten (in dieser Übung und in allen folgenden Übungen, die ebenfalls echte Twitter-Daten verwenden).
Diese Übung ist Teil des Kurses
<Kurs>Einführung in Natural Language Processing mit R</Kurs>Übungsanweisungen
- Erstelle ein Korpus anhand der Spalte
contentvonrussian_tweets. - Hänge die Spalten
followingundfollowersals Metadaten antweet_corpusan. - Gib die ersten Zeilen der Metadatentabelle aus.
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Create a corpus
tweet_corpus <- ___(___(russian_tweets$___))
# Attach following and followers
___(tweet_corpus, 'following') <- russian_tweets$___
___(tweet_corpus, 'followers') <- russian_tweets$___
# Review the meta data
head(meta(___))