Convierte el vector en un objeto VCorpus (1)
Recuerda que en el ejercicio anterior cargaste tus datos de texto en un vector llamado coffee_tweets. Tu siguiente paso es convertir ese vector con datos de texto en un corpus. Como viste en el vídeo, un corpus es una colección de documentos, pero también es importante saber que, en el ámbito de tm, R lo reconoce como un tipo de dato.
Existen dos variantes del tipo de dato corpus: el permanent corpus, PCorpus, y el volatile corpus, VCorpus. En esencia, la diferencia entre ambos tiene que ver con cómo se almacena la colección de documentos en tu ordenador. En este curso usaremos el corpus volátil, que se mantiene en la RAM del ordenador en lugar de guardarse en disco, para ser más eficientes con la memoria.
Para crear un corpus volátil, R necesita interpretar cada elemento de nuestro vector de texto, coffee_tweets, como un documento. Y el paquete tm proporciona las funciones Source para hacer exactamente eso. En este ejercicio, usaremos una función Source llamada VectorSource() porque nuestros datos de texto están en un vector. El resultado de esta función se denomina objeto Source. ¡Pruébalo!
Este ejercicio forma parte del curso
Minería de texto con Bag-of-Words en R
Instrucciones del ejercicio
- Carga el paquete
tm. - Crea un objeto Source a partir del vector
coffee_tweets. Llama a este nuevo objetocoffee_source.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Load tm
___
# Make a vector source from coffee_tweets
___