Termos frequentes com qdap
Se você não se importar em abrir mão de um pouco de controle sobre as etapas exatas de pré-processamento, uma forma rápida de obter termos frequentes é com freq_terms() do qdap.
A função aceita uma variável de texto que, no nosso caso, é o vetor tweets$text. Você pode especificar a quantidade de termos no topo a serem exibidos com o argumento top, um vetor de stop words para remover com o argumento stopwords, e o tamanho mínimo de caracteres de uma palavra a ser incluída com o argumento at.least. O qdap tem sua própria lista de stop words, que difere da do tm. Nosso exercício vai mostrar como usar qualquer uma delas e comparar os resultados.
Fazer um gráfico básico dos resultados é fácil. Basta chamar plot() no objeto retornado por freq_terms().
Este exercício faz parte do curso
Mineração de Texto com Bag-of-Words em R
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Create frequency
frequency <- ___(
___,
top = ___,
at.least = ___,
stopwords = ___
)
# Make a frequency bar chart