Explora un corpus en R
Una compañera ha preparado un corpus de 20 documentos sobre crudo, llamado crude. Esto es solo una muestra de varios miles de artículos que recibirás la próxima semana. Para prepararte para analizar estos textos, has decidido explorar su contenido y sus metadatos. Recuerda que en R, un VCorpus contiene tanto meta como content para cada texto. En esta lección, vas a explorar estos dos objetos.
Este ejercicio forma parte del curso
Introducción al procesamiento del lenguaje natural en R
Instrucciones del ejercicio
- Muestra
crudey revisa el resultado. - Imprime el contenido del artículo 10.
- Imprime el ID del primer artículo en
crude. - Usando el bucle for proporcionado, crea un vector con los ID del corpus.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Print out the corpus
print(___)
# Print the content of the 10th article
crude[[___]]$___
# Find the first ID
crude[[___]]$___$id
# Make a vector of IDs
ids <- c()
for(i in c(1:20)){
ids <- append(ids, crude[[___]]$___$id)
}