Encontrar palabras en común

Imagina que quieres visualizar palabras comunes en varios documentos. Puedes hacerlo con commonality.cloud().

Cada uno de nuestros corpus de coffee y chardonnay está compuesto por muchos tuits individuales. Para tratar los tuits de coffee como un único documento, y lo mismo para chardonnay, usa paste() para unir todos los tuits de cada corpus con el parámetro collapse = " ". Esto colapsa todos los tuits (separados por un espacio) en un único vector. Luego puedes crear un único vector que contenga los dos documentos colapsados.

a_single_string <- paste(a_character_vector, collapse = " ")

Cuando termines estos pasos, puedes seguir el mismo enfoque que ya has visto para crear un VCorpus() a partir de un VectorSource del objeto all_tweets.

Este ejercicio forma parte del curso

Minería de texto con Bag-of-Words en R

Ver curso

Instrucciones del ejercicio

Crea all_coffee usando paste() con collapse = " " sobre coffee_tweets$text.
Crea all_chardonnay usando paste() con collapse = " " sobre chardonnay_tweets$text.
Crea all_tweets usando c() para combinar all_coffee y all_chardonnay. Pon all_coffee como primer término.
Convierte all_tweets usando VectorSource().
Crea all_corpus usando VCorpus() sobre all_tweets.

ejercicio interactivo práctico

Prueba este ejercicio completando este código de ejemplo.

# Create all_coffee
___ <- ___(___, ___)

# Create all_chardonnay
___ <- ___(___, ___)

# Create all_tweets
___ <- ___(___, ___)

# Convert to a vector source
___ <- ___(___)

# Create all_corpus
___ <- ___(___)

Editar y ejecutar código