IniziaInizia gratis

Crea un corpus e converti in minuscolo

Un corpus è un elenco di documenti testuali. Devi convertire il testo dei tweet in un corpus per facilitare i passaggi successivi dell’elaborazione del testo.

Quando analizzi il testo, è importante fare in modo che una parola non venga conteggiata come due parole diverse solo perché in un caso è maiuscola e nell’altro minuscola. Per questo, devi convertire il testo in minuscolo.

In questo esercizio, creerai un corpus di testo e convertirai tutti i caratteri in minuscolo.

L’output di testo ripulito dall’esercizio precedente è stato caricato come twts_gsub.

La libreria tm è stata pre-caricata per questo esercizio.

Questo esercizio fa parte del corso

Analisi dei dati dei social media in R

Visualizza il corso

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Convert text in "twt_gsub" dataset to a text corpus and view output
twt_corpus <- twt_gsub %>% 
                ___() %>% 
                ___() 
head(twt_corpus$___)
Modifica ed esegui il codice