Encontrar palabras en común
Imagina que quieres visualizar palabras comunes en varios documentos. Puedes hacerlo con commonality.cloud().
Cada uno de nuestros corpus de coffee y chardonnay está compuesto por muchos tuits individuales. Para tratar los tuits de coffee como un único documento, y lo mismo para chardonnay, usa paste() para unir todos los tuits de cada corpus con el parámetro collapse = " ". Esto colapsa todos los tuits (separados por un espacio) en un único vector. Luego puedes crear un único vector que contenga los dos documentos colapsados.
a_single_string <- paste(a_character_vector, collapse = " ")
Cuando termines estos pasos, puedes seguir el mismo enfoque que ya has visto para crear un VCorpus() a partir de un VectorSource del objeto all_tweets.
Este ejercicio forma parte del curso
Minería de texto con Bag-of-Words en R
Instrucciones del ejercicio
- Crea
all_coffeeusandopaste()concollapse = " "sobrecoffee_tweets$text. - Crea
all_chardonnayusandopaste()concollapse = " "sobrechardonnay_tweets$text. - Crea
all_tweetsusandoc()para combinarall_coffeeyall_chardonnay. Ponall_coffeecomo primer término. - Convierte
all_tweetsusandoVectorSource(). - Crea
all_corpususandoVCorpus()sobreall_tweets.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Create all_coffee
___ <- ___(___, ___)
# Create all_chardonnay
___ <- ___(___, ___)
# Create all_tweets
___ <- ___(___, ___)
# Convert to a vector source
___ <- ___(___)
# Create all_corpus
___ <- ___(___)