Esplora un corpus in R
Una tua collega ha preparato un corpus di 20 documenti che parlano di petrolio greggio, chiamato crude. È solo un campione di diverse migliaia di articoli che riceverai la prossima settimana. Per prepararti ad eseguire analisi del testo su questi documenti, hai deciso di esplorarne contenuto e metadati. Ricorda che in R un VCorpus contiene sia meta sia content relativi a ciascun testo. In questa lezione esplorerai questi due oggetti.
Questo esercizio fa parte del corso
Introduzione all'Elaborazione del Linguaggio Naturale in R
Istruzioni dell'esercizio
- Stampa
crudee rivedi l'output. - Stampa il contenuto del decimo articolo.
- Stampa l'ID del primo articolo in
crude. - Usando il ciclo for fornito, crea un vettore degli ID dal corpus.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Print out the corpus
print(___)
# Print the content of the 10th article
crude[[___]]$___
# Find the first ID
crude[[___]]$___$id
# Make a vector of IDs
ids <- c()
for(i in c(1:20)){
ids <- append(ids, crude[[___]]$___$id)
}