ComeçarComece de graça

Encontrar palavras em comum

Suponha que você queira visualizar palavras em comum em vários documentos. Você pode fazer isso com commonality.cloud().

Cada um dos nossos corpora de coffee e chardonnay é composto por muitos tweets individuais. Para tratar os tweets de coffee como um único documento, e o mesmo para chardonnay, você usa paste() para juntar todos os tweets em cada corpus com o parâmetro collapse = " ". Isso condensa todos os tweets (separados por um espaço) em um único vetor. Depois, você pode criar um único vetor contendo os dois documentos condensados.

a_single_string <- paste(a_character_vector, collapse = " ")

Quando terminar essas etapas, você pode adotar a mesma abordagem que viu antes para criar um VCorpus() com base em um VectorSource a partir do objeto all_tweets.

Este exercício faz parte do curso

Mineração de Texto com Bag-of-Words em R

Ver curso

Instruções do exercício

  • Crie all_coffee usando paste() com collapse = " " em coffee_tweets$text.
  • Crie all_chardonnay usando paste() com collapse = " " em chardonnay_tweets$text.
  • Crie all_tweets usando c() para combinar all_coffee e all_chardonnay. Coloque all_coffee como o primeiro termo.
  • Converta all_tweets usando VectorSource().
  • Crie all_corpus usando VCorpus() em all_tweets.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Create all_coffee
___ <- ___(___, ___)

# Create all_chardonnay
___ <- ___(___, ___)

# Create all_tweets
___ <- ___(___, ___)

# Convert to a vector source
___ <- ___(___)

# Create all_corpus
___ <- ___(___)
Editar e executar o código