ComenzarEmpieza gratis

Sentimiento y emoción

Dentro del conjunto de datos sentiments, el léxico nrc contiene un diccionario de palabras y una emoción asociada a cada una. Emociones como joy, trust, anticipation y otras se encuentran en este conjunto.

En el conjunto de datos de bots de Twitter rusos que has estado explorando, has analizado tuits enviados por un bot con sesgo de izquierdas y otro con sesgo de derechas. Explora el contenido de los tuits enviados por el bot de tendencia izquierdista (demócrata) usando el léxico nrc. Los tuits de la izquierda, left, se han tokenizado en palabras y se han eliminado las stop-words.

Este ejercicio forma parte del curso

Introducción al procesamiento del lenguaje natural en R

Ver curso

Instrucciones del ejercicio

  • Crea un tibble solo con las palabras de anticipation del léxico nrc.
  • Crea un tibble solo con las palabras de joy del léxico nrc.
  • Muestra las principales palabras de anticipation encontradas en left_tokens.
  • Muestra las principales palabras de joy encontradas en left_tokens.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

left_tokens <- left %>%
  unnest_tokens(output = "word", token = "words", input = content) %>%
  anti_join(stop_words)
# Dictionaries 
anticipation <- ___("nrc") %>% 
  ___(sentiment == "anticipation")
joy <- ___("nrc") %>% 
  ___(sentiment == "joy")
# Print top words for Anticipation and Joy
left_tokens %>%
  ___(anticipation, by = "word") %>%
  ___(word, sort = TRUE)
left_tokens %>%
  ___(joy, by = "word") %>%
  ___(word, sort = TRUE)
Editar y ejecutar código