ComeçarComece de graça

Sentimento e emoção

No conjunto de dados sentiments, o léxico nrc contém um dicionário de palavras e uma emoção associada a cada palavra. Emoções como joy, trust, anticipation e outras estão presentes nesse conjunto.

No conjunto de dados de bots russos no Twitter que você vem explorando, você analisou tweets enviados por bots com inclinação à esquerda e à direita. Explore o conteúdo dos tweets enviados pelo bot com inclinação à esquerda (democrata) usando o léxico nrc. Os tweets de esquerda, left, foram tokenizados em palavras, com as stopwords removidas.

Este exercício faz parte do curso

Introdução ao Processamento de Linguagem Natural em R

Ver curso

Instruções do exercício

  • Crie um tibble apenas com as palavras de anticipation do léxico nrc.
  • Crie um tibble apenas com as palavras de joy do léxico nrc.
  • Mostre as principais palavras de anticipation encontradas em left_tokens.
  • Mostre as principais palavras de joy encontradas em left_tokens.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

left_tokens <- left %>%
  unnest_tokens(output = "word", token = "words", input = content) %>%
  anti_join(stop_words)
# Dictionaries 
anticipation <- ___("nrc") %>% 
  ___(sentiment == "anticipation")
joy <- ___("nrc") %>% 
  ___(sentiment == "joy")
# Print top words for Anticipation and Joy
left_tokens %>%
  ___(anticipation, by = "word") %>%
  ___(word, sort = TRUE)
left_tokens %>%
  ___(joy, by = "word") %>%
  ___(word, sort = TRUE)
Editar e executar o código