Encontrar palavras em comum
Suponha que você queira visualizar palavras em comum em vários documentos. Você pode fazer isso com commonality.cloud().
Cada um dos nossos corpora de coffee e chardonnay é composto por muitos tweets individuais. Para tratar os tweets de coffee como um único documento, e o mesmo para chardonnay, você usa paste() para juntar todos os tweets em cada corpus com o parâmetro collapse = " ". Isso condensa todos os tweets (separados por um espaço) em um único vetor. Depois, você pode criar um único vetor contendo os dois documentos condensados.
a_single_string <- paste(a_character_vector, collapse = " ")
Quando terminar essas etapas, você pode adotar a mesma abordagem que viu antes para criar um VCorpus() com base em um VectorSource a partir do objeto all_tweets.
Este exercício faz parte do curso
Mineração de Texto com Bag-of-Words em R
Instruções do exercício
- Crie
all_coffeeusandopaste()comcollapse = " "emcoffee_tweets$text. - Crie
all_chardonnayusandopaste()comcollapse = " "emchardonnay_tweets$text. - Crie
all_tweetsusandoc()para combinarall_coffeeeall_chardonnay. Coloqueall_coffeecomo o primeiro termo. - Converta
all_tweetsusandoVectorSource(). - Crie
all_corpususandoVCorpus()emall_tweets.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Create all_coffee
___ <- ___(___, ___)
# Create all_chardonnay
___ <- ___(___, ___)
# Create all_tweets
___ <- ___(___, ___)
# Convert to a vector source
___ <- ___(___)
# Create all_corpus
___ <- ___(___)