Uma nuvem de palavras simples

Neste ponto, você já tomou café demais. Além disso, ver as palavras no topo como "shop", "morning" e "drinking", entre outras, não é lá tão revelador.

Para celebrar que você chegou até aqui, vamos analisar outro lote de 1000 tweets. Por enquanto, você não sabe o que eles têm em comum, mas vamos ver se você consegue descobrir usando uma nuvem de palavras. Os valores de frequência de termos dos tweets já estão pré-carregados no seu espaço de trabalho.

Uma nuvem de palavras é uma visualização de termos. Em uma nuvem de palavras, o tamanho geralmente é escalonado pela frequência e, em alguns casos, as cores podem indicar outra métrica. Por enquanto, vamos manter simples: o tamanho está relacionado à frequência individual de cada palavra, e vamos usar uma única cor.

Como você viu no vídeo, a função wordcloud() funciona assim:

wordcloud(words, frequencies, max.words = 500, colors = "blue")

Análises de mineração de texto frequentemente incluem nuvens de palavras simples. Na verdade, elas provavelmente são usadas em excesso, mas ainda podem ser úteis para entender rapidamente um conjunto de textos!

term_frequency já está carregado no seu espaço de trabalho.

Este exercício faz parte do curso

Mineração de Texto com Bag-of-Words em R

Ver curso

Instruções do exercício

Carregue o pacote wordcloud.
Imprima as 10 primeiras entradas em term_frequency.
Extraia os termos usando names() em term_frequency. Chame o vetor de strings de terms_vec.
Crie uma wordcloud() usando terms_vec como palavras e term_frequency como valores. Adicione os parâmetros max.words = 50 e colors = "red".

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Load wordcloud package


# Print the first 10 entries in term_frequency


# Vector of terms


# Create a word cloud for the values in word_freqs

Editar e executar o código