LoslegenKostenlos loslegen

Ein Korpus erstellen

Du hast ein Tibble namens russian_tweets erstellt, das etwa 20.000 Tweets enthält, die während des US-Wahlzyklus 2016 automatisch von Bots generiert wurden, damit du Textanalysen durchführen kannst. Bei der Suche nach geeigneten Möglichkeiten für deine geplante Analyse hältst du das Paket tm für den einfachsten Weg. Um die Analyse durchzuführen, musst du zuerst ein Korpus erstellen und potenziell nützliche Metadaten anhängen.

Achte darauf, dass es sich um echte Daten von Twitter handelt. Es besteht daher immer das Risiko, dass sie Obszönitäten oder andere anstößige Inhalte enthalten (in dieser Übung und in allen folgenden Übungen, die ebenfalls echte Twitter-Daten verwenden).

Diese Übung ist Teil des Kurses

Einführung in Natural Language Processing mit R

Kurs anzeigen

Anleitung zur Übung

  • Erstelle ein Korpus anhand der Spalte content von russian_tweets.
  • Hänge die Spalten following und followers als Metadaten an tweet_corpus an.
  • Gib die ersten Zeilen der Metadatentabelle aus.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Create a corpus
tweet_corpus <- ___(___(russian_tweets$___))

# Attach following and followers
___(tweet_corpus, 'following') <- russian_tweets$___
___(tweet_corpus, 'followers') <- russian_tweets$___

# Review the meta data
head(meta(___))
Code bearbeiten und ausführen