Encontrar palavras em comum

Suponha que você queira visualizar palavras em comum em vários documentos. Você pode fazer isso com commonality.cloud().

Cada um dos nossos corpora de coffee e chardonnay é composto por muitos tweets individuais. Para tratar os tweets de coffee como um único documento, e o mesmo para chardonnay, você usa paste() para juntar todos os tweets em cada corpus com o parâmetro collapse = " ". Isso condensa todos os tweets (separados por um espaço) em um único vetor. Depois, você pode criar um único vetor contendo os dois documentos condensados.

a_single_string <- paste(a_character_vector, collapse = " ")

Quando terminar essas etapas, você pode adotar a mesma abordagem que viu antes para criar um VCorpus() com base em um VectorSource a partir do objeto all_tweets.

Este exercicio faz parte do curso

Mineração de Texto com Bag-of-Words em R

Ver curso

Instruções do exercicio

Crie all_coffee usando paste() com collapse = " " em coffee_tweets$text.
Crie all_chardonnay usando paste() com collapse = " " em chardonnay_tweets$text.
Crie all_tweets usando c() para combinar all_coffee e all_chardonnay. Coloque all_coffee como o primeiro termo.
Converta all_tweets usando VectorSource().
Crie all_corpus usando VCorpus() em all_tweets.

exercicio interativo prático

Tente este exercicio completando este código de exemplo.

# Create all_coffee
___ <- ___(___, ___)

# Create all_chardonnay
___ <- ___(___, ___)

# Create all_tweets
___ <- ___(___, ___)

# Convert to a vector source
___ <- ___(___)

# Create all_corpus
___ <- ___(___)

Editar e Executar Código