LoslegenKostenlos starten

Ein Korpus erstellen

Du hast ein Tibble namens russian_tweets erstellt, das etwa 20.000 Tweets enthält, die während des US-Wahlzyklus 2016 automatisch von Bots generiert wurden, damit du Textanalysen durchführen kannst. Bei der Suche nach geeigneten Möglichkeiten für deine geplante Analyse hältst du das Paket tm für den einfachsten Weg. Um die Analyse durchzuführen, musst du zuerst ein Korpus erstellen und potenziell nützliche Metadaten anhängen.

Achte darauf, dass es sich um echte Daten von Twitter handelt. Es besteht daher immer das Risiko, dass sie Obszönitäten oder andere anstößige Inhalte enthalten (in dieser Übung und in allen folgenden Übungen, die ebenfalls echte Twitter-Daten verwenden).

Diese Übung ist Teil des Kurses

<Kurs>Einführung in Natural Language Processing mit R</Kurs>
Kurs ansehen

Übungsanweisungen

  • Erstelle ein Korpus anhand der Spalte content von russian_tweets.
  • Hänge die Spalten following und followers als Metadaten an tweet_corpus an.
  • Gib die ersten Zeilen der Metadatentabelle aus.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Create a corpus
tweet_corpus <- ___(___(russian_tweets$___))

# Attach following and followers
___(tweet_corpus, 'following') <- russian_tweets$___
___(tweet_corpus, 'followers') <- russian_tweets$___

# Review the meta data
head(meta(___))
Code bearbeiten und ausführen