Términos frecuentes con qdap

Si no te importa ceder algo de control sobre los pasos exactos de preprocesamiento, una forma rápida de obtener términos frecuentes es con freq_terms() de qdap.

La función acepta una variable de texto que, en nuestro caso, es el vector tweets$text. Puedes indicar cuántos términos superiores quieres mostrar con el argumento top, un vector de stop words que quieres eliminar con el argumento stopwords, y la longitud mínima de caracteres de una palabra que debe incluirse con el argumento at.least. qdap tiene su propia lista de stop words, que difiere de la de tm. En este ejercicio verás cómo usar una u otra y comparar sus resultados.

Hacer un gráfico básico de los resultados es sencillo. Solo llama a plot() sobre el objeto devuelto por freq_terms().

Este ejercicio forma parte del curso

Minería de texto con Bag-of-Words en R

Ver curso

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Create frequency
frequency <- ___(
  ___, 
  top = ___, 
  at.least = ___, 
  stopwords = ___
)

# Make a frequency bar chart

Editar y ejecutar código