Sentimiento y emoción
Dentro del conjunto de datos sentiments, el léxico nrc contiene un diccionario de palabras y una emoción asociada a cada una. Emociones como joy, trust, anticipation y otras se encuentran en este conjunto.
En el conjunto de datos de bots de Twitter rusos que has estado explorando, has analizado tuits enviados por un bot con sesgo de izquierdas y otro con sesgo de derechas. Explora el contenido de los tuits enviados por el bot de tendencia izquierdista (demócrata) usando el léxico nrc. Los tuits de la izquierda, left, se han tokenizado en palabras y se han eliminado las stop-words.
Este ejercicio forma parte del curso
Introducción al procesamiento del lenguaje natural en R
Instrucciones del ejercicio
- Crea un tibble solo con las palabras de anticipation del léxico
nrc. - Crea un tibble solo con las palabras de joy del léxico
nrc. - Muestra las principales palabras de
anticipationencontradas enleft_tokens. - Muestra las principales palabras de
joyencontradas enleft_tokens.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
left_tokens <- left %>%
unnest_tokens(output = "word", token = "words", input = content) %>%
anti_join(stop_words)
# Dictionaries
anticipation <- ___("nrc") %>%
___(sentiment == "anticipation")
joy <- ___("nrc") %>%
___(sentiment == "joy")
# Print top words for Anticipation and Joy
left_tokens %>%
___(anticipation, by = "word") %>%
___(word, sort = TRUE)
left_tokens %>%
___(joy, by = "word") %>%
___(word, sort = TRUE)