ComeçarComece de graça

Explore um corpus em R

Uma pessoa da sua equipe preparou um corpus com 20 documentos sobre petróleo bruto, chamado crude. Este é apenas uma amostra de vários milhares de artigos que você receberá na próxima semana. Para se preparar para a análise de texto nesses documentos, você decidiu explorar seu conteúdo e metadados. Lembre-se de que, em R, um VCorpus contém tanto meta quanto content de cada texto. Nesta lição, você vai explorar esses dois objetos.

Este exercício faz parte do curso

Introdução ao Processamento de Linguagem Natural em R

Ver curso

Instruções do exercício

  • Imprima crude e revise a saída.
  • Imprima o conteúdo do 10º artigo.
  • Imprima o ID do primeiro artigo em crude.
  • Usando o laço for fornecido, crie um vetor com os IDs do corpus.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Print out the corpus
print(___)

# Print the content of the 10th article
crude[[___]]$___

# Find the first ID
crude[[___]]$___$id

# Make a vector of IDs
ids <- c()
for(i in c(1:20)){
  ids <- append(ids, crude[[___]]$___$id)
}
Editar e executar o código