Termos frequentes com qdap

Se você não se importar em abrir mão de um pouco de controle sobre as etapas exatas de pré-processamento, uma forma rápida de obter termos frequentes é com freq_terms() do qdap.

A função aceita uma variável de texto que, no nosso caso, é o vetor tweets$text. Você pode especificar a quantidade de termos no topo a serem exibidos com o argumento top, um vetor de stop words para remover com o argumento stopwords, e o tamanho mínimo de caracteres de uma palavra a ser incluída com o argumento at.least. O qdap tem sua própria lista de stop words, que difere da do tm. Nosso exercício vai mostrar como usar qualquer uma delas e comparar os resultados.

Fazer um gráfico básico dos resultados é fácil. Basta chamar plot() no objeto retornado por freq_terms().

Este exercicio faz parte do curso

Mineração de Texto com Bag-of-Words em R

Ver curso

exercicio interativo prático

Tente este exercicio completando este código de exemplo.

# Create frequency
frequency <- ___(
  ___, 
  top = ___, 
  at.least = ___, 
  stopwords = ___
)

# Make a frequency bar chart

Editar e Executar Código