IniziaInizia gratis

Creare un corpus

Hai creato una tibble chiamata russian_tweets che contiene circa 20.000 tweet generati automaticamente da bot durante il ciclo elettorale statunitense del 2016, così da poter eseguire un'analisi del testo. Tuttavia, dopo aver esaminato le opzioni disponibili per l'analisi che vuoi svolgere, ritieni che il pacchetto tm offra la strada più semplice. Per poter condurre l'analisi, devi prima creare un corpus e allegare metadati potenzialmente utili.

Fai attenzione: si tratta di dati reali provenienti da Twitter e, in quanto tali, c'è sempre il rischio che contengano volgarità o altri contenuti offensivi (in questo esercizio e in qualunque altro esercizio successivo che utilizzi dati reali di Twitter).

Questo esercizio fa parte del corso

Introduzione all'Elaborazione del Linguaggio Naturale in R

Visualizza il corso

Istruzioni dell'esercizio

  • Crea un corpus usando la colonna content di russian_tweets.
  • Allega le colonne following e followers come metadati a tweet_corpus.
  • Stampa le prime righe della tabella dei metadati.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Create a corpus
tweet_corpus <- ___(___(russian_tweets$___))

# Attach following and followers
___(tweet_corpus, 'following') <- russian_tweets$___
___(tweet_corpus, 'followers') <- russian_tweets$___

# Review the meta data
head(meta(___))
Modifica ed esegui il codice