Transforme o vetor em um objeto VCorpus (1)
Lembre que você carregou seus dados de texto como um vetor chamado coffee_tweets no último exercício. Seu próximo passo é converter esse vetor com os dados de texto em um corpus. Como você viu no vídeo, um corpus é uma coleção de documentos, mas também é importante saber que, no domínio do tm, o R o reconhece como um tipo de dado.
Existem dois tipos do tipo de dado corpus: o permanent corpus, PCorpus, e o volatile corpus, VCorpus. Em essência, a diferença entre eles está em como a coleção de documentos é armazenada no seu computador. Neste curso, vamos usar o volatile corpus, que fica na RAM do seu computador em vez de ser salvo em disco, para ser mais eficiente em memória.
Para criar um volatile corpus, o R precisa interpretar cada elemento do nosso vetor de texto, coffee_tweets, como um documento. E o pacote tm fornece as chamadas funções Source para fazer exatamente isso! Neste exercício, vamos usar uma função Source chamada VectorSource() porque nossos dados de texto estão em um vetor. A saída dessa função é chamada de objeto Source. Experimente!
Este exercício faz parte do curso
Mineração de Texto com Bag-of-Words em R
Instruções do exercício
- Carregue o pacote
tm. - Crie um objeto Source a partir do vetor
coffee_tweets. Chame esse novo objeto decoffee_source.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Load tm
___
# Make a vector source from coffee_tweets
___