IniziaInizia gratis

Trasforma il vettore in un oggetto VCorpus (1)

Ricorda che hai caricato i tuoi dati testuali come un vettore chiamato coffee_tweets nell'esercizio precedente. Il prossimo passo è convertire questo vettore che contiene dati testuali in un corpus. Come hai visto nel video, un corpus è una raccolta di documenti, ma è anche importante sapere che nel dominio di tm, R lo riconosce come un tipo di dato.

Esistono due tipi del tipo di dato corpus: il permanent corpus, PCorpus, e il volatile corpus, VCorpus. In sostanza, la differenza tra i due riguarda il modo in cui la raccolta di documenti viene archiviata sul tuo computer. In questo corso useremo il volatile corpus, che viene mantenuto nella RAM del tuo computer invece di essere salvato su disco, così da essere più efficiente in memoria.

Per creare un volatile corpus, R deve interpretare ogni elemento del nostro vettore di testo, coffee_tweets, come un documento. E il pacchetto tm fornisce le cosiddette funzioni Source proprio per questo scopo! In questo esercizio useremo una funzione Source chiamata VectorSource() perché i nostri dati testuali sono contenuti in un vettore. L'output di questa funzione è chiamato oggetto Source. Prova tu!

Questo esercizio fa parte del corso

Text mining con Bag-of-Words in R

Visualizza il corso

Istruzioni dell'esercizio

  • Carica il pacchetto tm.
  • Crea un oggetto Source dal vettore coffee_tweets. Chiama questo nuovo oggetto coffee_source.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Load tm
___

# Make a vector source from coffee_tweets
___
Modifica ed esegui il codice