ComeçarComece de graça

Transforme o vetor em um objeto VCorpus (1)

Lembre que você carregou seus dados de texto como um vetor chamado coffee_tweets no último exercício. Seu próximo passo é converter esse vetor com os dados de texto em um corpus. Como você viu no vídeo, um corpus é uma coleção de documentos, mas também é importante saber que, no domínio do tm, o R o reconhece como um tipo de dado.

Existem dois tipos do tipo de dado corpus: o permanent corpus, PCorpus, e o volatile corpus, VCorpus. Em essência, a diferença entre eles está em como a coleção de documentos é armazenada no seu computador. Neste curso, vamos usar o volatile corpus, que fica na RAM do seu computador em vez de ser salvo em disco, para ser mais eficiente em memória.

Para criar um volatile corpus, o R precisa interpretar cada elemento do nosso vetor de texto, coffee_tweets, como um documento. E o pacote tm fornece as chamadas funções Source para fazer exatamente isso! Neste exercício, vamos usar uma função Source chamada VectorSource() porque nossos dados de texto estão em um vetor. A saída dessa função é chamada de objeto Source. Experimente!

Este exercício faz parte do curso

Mineração de Texto com Bag-of-Words em R

Ver curso

Instruções do exercício

  • Carregue o pacote tm.
  • Crie um objeto Source a partir do vetor coffee_tweets. Chame esse novo objeto de coffee_source.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Load tm
___

# Make a vector source from coffee_tweets
___
Editar e executar o código