IniziaInizia gratis

Esplora un corpus in R

Una tua collega ha preparato un corpus di 20 documenti che parlano di petrolio greggio, chiamato crude. È solo un campione di diverse migliaia di articoli che riceverai la prossima settimana. Per prepararti ad eseguire analisi del testo su questi documenti, hai deciso di esplorarne contenuto e metadati. Ricorda che in R un VCorpus contiene sia meta sia content relativi a ciascun testo. In questa lezione esplorerai questi due oggetti.

Questo esercizio fa parte del corso

Introduzione all'Elaborazione del Linguaggio Naturale in R

Visualizza il corso

Istruzioni dell'esercizio

  • Stampa crude e rivedi l'output.
  • Stampa il contenuto del decimo articolo.
  • Stampa l'ID del primo articolo in crude.
  • Usando il ciclo for fornito, crea un vettore degli ID dal corpus.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Print out the corpus
print(___)

# Print the content of the 10th article
crude[[___]]$___

# Find the first ID
crude[[___]]$___$id

# Make a vector of IDs
ids <- c()
for(i in c(1:20)){
  ids <- append(ids, crude[[___]]$___$id)
}
Modifica ed esegui il codice