Creare un corpus
Hai creato una tibble chiamata russian_tweets che contiene circa 20.000 tweet generati automaticamente da bot durante il ciclo elettorale statunitense del 2016, così da poter eseguire un'analisi del testo. Tuttavia, dopo aver esaminato le opzioni disponibili per l'analisi che vuoi svolgere, ritieni che il pacchetto tm offra la strada più semplice. Per poter condurre l'analisi, devi prima creare un corpus e allegare metadati potenzialmente utili.
Fai attenzione: si tratta di dati reali provenienti da Twitter e, in quanto tali, c'è sempre il rischio che contengano volgarità o altri contenuti offensivi (in questo esercizio e in qualunque altro esercizio successivo che utilizzi dati reali di Twitter).
Questo esercizio fa parte del corso
Introduzione all'Elaborazione del Linguaggio Naturale in R
Istruzioni dell'esercizio
- Crea un corpus usando la colonna
contentdirussian_tweets. - Allega le colonne
followingefollowerscome metadati atweet_corpus. - Stampa le prime righe della tabella dei metadati.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Create a corpus
tweet_corpus <- ___(___(russian_tweets$___))
# Attach following and followers
___(tweet_corpus, 'following') <- russian_tweets$___
___(tweet_corpus, 'followers') <- russian_tweets$___
# Review the meta data
head(meta(___))