Uma nuvem de palavras simples
Neste ponto, você já tomou café demais. Além disso, ver as palavras no topo como "shop", "morning" e "drinking", entre outras, não é lá tão revelador.
Para celebrar que você chegou até aqui, vamos analisar outro lote de 1000 tweets. Por enquanto, você não sabe o que eles têm em comum, mas vamos ver se você consegue descobrir usando uma nuvem de palavras. Os valores de frequência de termos dos tweets já estão pré-carregados no seu espaço de trabalho.
Uma nuvem de palavras é uma visualização de termos. Em uma nuvem de palavras, o tamanho geralmente é escalonado pela frequência e, em alguns casos, as cores podem indicar outra métrica. Por enquanto, vamos manter simples: o tamanho está relacionado à frequência individual de cada palavra, e vamos usar uma única cor.
Como você viu no vídeo, a função wordcloud() funciona assim:
wordcloud(words, frequencies, max.words = 500, colors = "blue")
Análises de mineração de texto frequentemente incluem nuvens de palavras simples. Na verdade, elas provavelmente são usadas em excesso, mas ainda podem ser úteis para entender rapidamente um conjunto de textos!
term_frequency já está carregado no seu espaço de trabalho.
Este exercício faz parte do curso
Mineração de Texto com Bag-of-Words em R
Instruções do exercício
- Carregue o pacote
wordcloud. - Imprima as 10 primeiras entradas em
term_frequency. - Extraia os termos usando
names()emterm_frequency. Chame o vetor de strings determs_vec. - Crie uma
wordcloud()usandoterms_veccomo palavras eterm_frequencycomo valores. Adicione os parâmetrosmax.words = 50ecolors = "red".
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Load wordcloud package
# Print the first 10 entries in term_frequency
# Vector of terms
# Create a word cloud for the values in word_freqs