Extracción y análisis de características: amzn_cons
Ahora decides contrastarlo con el corpus amzn_cons_corp en otra TDM de bigramas. Por supuesto, esperas ver algunas frases distintas en tu nube de palabras.
Una vez más, usarás esta función personalizada para extraer tus características de bigramas para la visualización:
tokenizer <- function(x)
NGramTokenizer(x, Weka_control(min = 2, max = 2))
Este ejercicio forma parte del curso
Minería de texto con Bag-of-Words en R
Instrucciones del ejercicio
- Crea
amzn_c_tdmconvirtiendoamzn_cons_corpen unTermDocumentMatrixe incorporando la función de bigramas concontrol = list(tokenize = tokenizer). - Crea
amzn_c_tdm_mcomo versión en matriz deamzn_c_tdm. - Crea
amzn_c_frequsandorowSums()para obtener las frecuencias de términos a partir deamzn_c_tdm_m. - Crea una
wordcloud()usandonames(amzn_c_freq)y los valoresamzn_c_freq. Usa también los argumentosmax.words = 25ycolor = "red".
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Create amzn_c_tdm
___ <- ___(
___,
___
)
# Create amzn_c_tdm_m
___ <- ___
# Create amzn_c_freq
___ <- ___
# Plot a word cloud of negative Amazon bigrams
___