IniziaInizia gratis

Rimozione di stop word personalizzate

I termini più ricorrenti in un corpus di testo possono essere visualizzati con bar plot o word cloud.

Tuttavia, prima di usare questi strumenti di visualizzazione è importante rimuovere le stop word personalizzate presenti nel corpus.

In questo esercizio controllerai le frequenze dei termini e rimuoverai le stop word personalizzate dal corpus di testo che hai creato per "telemedicine".

Il corpus di testo è stato precaricato come twt_corpus.

Le librerie qdap e tm sono state precaricate per questo esercizio.

Questo esercizio fa parte del corso

Analisi dei dati dei social media in R

Visualizza il corso

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Extract term frequencies for top 60 words and view output
termfreq  <-  ___(twt_corpus, ___)
termfreq
Modifica ed esegui il codice