Crea un corpus e converti in minuscolo
Un corpus è un elenco di documenti testuali. Devi convertire il testo dei tweet in un corpus per facilitare i passaggi successivi dell’elaborazione del testo.
Quando analizzi il testo, è importante fare in modo che una parola non venga conteggiata come due parole diverse solo perché in un caso è maiuscola e nell’altro minuscola. Per questo, devi convertire il testo in minuscolo.
In questo esercizio, creerai un corpus di testo e convertirai tutti i caratteri in minuscolo.
L’output di testo ripulito dall’esercizio precedente è stato caricato come twts_gsub.
La libreria tm è stata pre-caricata per questo esercizio.
Questo esercizio fa parte del corso
Analisi dei dati dei social media in R
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Convert text in "twt_gsub" dataset to a text corpus and view output
twt_corpus <- twt_gsub %>%
___() %>%
___()
head(twt_corpus$___)