Sentimento e emoção
No conjunto de dados sentiments, o léxico nrc contém um dicionário de palavras e uma emoção associada a cada palavra. Emoções como joy, trust, anticipation e outras estão presentes nesse conjunto.
No conjunto de dados de bots russos no Twitter que você vem explorando, você analisou tweets enviados por bots com inclinação à esquerda e à direita. Explore o conteúdo dos tweets enviados pelo bot com inclinação à esquerda (democrata) usando o léxico nrc. Os tweets de esquerda, left, foram tokenizados em palavras, com as stopwords removidas.
Este exercício faz parte do curso
Introdução ao Processamento de Linguagem Natural em R
Instruções do exercício
- Crie um tibble apenas com as palavras de anticipation do léxico
nrc. - Crie um tibble apenas com as palavras de joy do léxico
nrc. - Mostre as principais palavras de
anticipationencontradas emleft_tokens. - Mostre as principais palavras de
joyencontradas emleft_tokens.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
left_tokens <- left %>%
unnest_tokens(output = "word", token = "words", input = content) %>%
anti_join(stop_words)
# Dictionaries
anticipation <- ___("nrc") %>%
___(sentiment == "anticipation")
joy <- ___("nrc") %>%
___(sentiment == "joy")
# Print top words for Anticipation and Joy
left_tokens %>%
___(anticipation, by = "word") %>%
___(word, sort = TRUE)
left_tokens %>%
___(joy, by = "word") %>%
___(word, sort = TRUE)