Sentimiento y emoción

Dentro del conjunto de datos sentiments, el léxico nrc contiene un diccionario de palabras y una emoción asociada a cada una. Emociones como joy, trust, anticipation y otras se encuentran en este conjunto.

En el conjunto de datos de bots de Twitter rusos que has estado explorando, has analizado tuits enviados por un bot con sesgo de izquierdas y otro con sesgo de derechas. Explora el contenido de los tuits enviados por el bot de tendencia izquierdista (demócrata) usando el léxico nrc. Los tuits de la izquierda, left, se han tokenizado en palabras y se han eliminado las stop-words.

Este ejercicio forma parte del curso

Introducción al procesamiento del lenguaje natural en R

Ver curso

Instrucciones del ejercicio

Crea un tibble solo con las palabras de anticipation del léxico nrc.
Crea un tibble solo con las palabras de joy del léxico nrc.
Muestra las principales palabras de anticipation encontradas en left_tokens.
Muestra las principales palabras de joy encontradas en left_tokens.

ejercicio interactivo práctico

Prueba este ejercicio completando este código de ejemplo.

left_tokens <- left %>%
  unnest_tokens(output = "word", token = "words", input = content) %>%
  anti_join(stop_words)
# Dictionaries 
anticipation <- ___("nrc") %>% 
  ___(sentiment == "anticipation")
joy <- ___("nrc") %>% 
  ___(sentiment == "joy")
# Print top words for Anticipation and Joy
left_tokens %>%
  ___(anticipation, by = "word") %>%
  ___(word, sort = TRUE)
left_tokens %>%
  ___(joy, by = "word") %>%
  ___(word, sort = TRUE)

Editar y ejecutar código

Introducción al procesamiento del lenguaje natural en R

IntermedioNivel de habilidad

4.8+

40 reviews

En el capítulo 4 cubrimos dos pilares del procesamiento del lenguaje natural: el análisis de sentimiento y las incrustaciones de palabras. Son dos técnicas imprescindibles para quien aprende los fundamentos del análisis de texto. Además, verás brevemente BERT, el etiquetado gramatical (part-of-speech) y el reconocimiento de entidades con nombre. En este curso se han cubierto casi 15 técnicas de análisis diferentes, así que el capítulo 4 termina recapitulando todas las excelentes técnicas que conocerás en este curso.

Exercise 1: Análisis de sentimiento Exercise 2: léxicos de tidytext Exercise 3: Puntajes de sentimiento Exercise 4: Sentimiento y emoción

Ejercicio actual

Exercise 5: Word embeddings Exercise 6: Práctica con h2o Exercise 7: word2vec Exercise 8: Análisis adicional de NLP Exercise 9: Repaso de métodos #1 Exercise 10: Repaso de métodos #2 Exercise 11: Conclusión