Explore um corpus em R
Uma pessoa da sua equipe preparou um corpus com 20 documentos sobre petróleo bruto, chamado crude. Este é apenas uma amostra de vários milhares de artigos que você receberá na próxima semana. Para se preparar para a análise de texto nesses documentos, você decidiu explorar seu conteúdo e metadados. Lembre-se de que, em R, um VCorpus contém tanto meta quanto content de cada texto. Nesta lição, você vai explorar esses dois objetos.
Este exercício faz parte do curso
Introdução ao Processamento de Linguagem Natural em R
Instruções do exercício
- Imprima
crudee revise a saída. - Imprima o conteúdo do 10º artigo.
- Imprima o ID do primeiro artigo em
crude. - Usando o laço for fornecido, crie um vetor com os IDs do corpus.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Print out the corpus
print(___)
# Print the content of the 10th article
crude[[___]]$___
# Find the first ID
crude[[___]]$___$id
# Make a vector of IDs
ids <- c()
for(i in c(1:20)){
ids <- append(ids, crude[[___]]$___$id)
}