Sentiment en emotie

Binnen de sentiments-gegevensset bevat de nrc-lexicon een woordenboek met woorden en een bijbehorende emotie. Emoties zoals joy, trust, anticipation en andere komen in deze gegevensset voor.

In de Russische tweetbot-gegevensset die je hebt onderzocht, heb je gekeken naar tweets die zijn verstuurd door zowel een links- als een rechtsgeoriënteerde tweetbot. Verken de inhoud van de tweets die zijn verstuurd door de links georiënteerde (democratische) tweetbot met behulp van de nrc-lexicon. De linkse tweets, left, zijn getokenized in woorden, waarbij stopwoorden zijn verwijderd.

Deze oefening maakt deel uit van de cursus

Introductie tot Natural Language Processing in R

Bekijk cursus

Oefeninstructies

Maak een tibble met alleen de anticipation-woorden uit de nrc-lexicon.
Maak een tibble met alleen de joy-woorden uit de nrc-lexicon.
Print de belangrijkste anticipation-woorden die in left_tokens zijn gevonden.
Print de belangrijkste joy-woorden die in left_tokens zijn gevonden.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

left_tokens <- left %>%
  unnest_tokens(output = "word", token = "words", input = content) %>%
  anti_join(stop_words)
# Dictionaries 
anticipation <- ___("nrc") %>% 
  ___(sentiment == "anticipation")
joy <- ___("nrc") %>% 
  ___(sentiment == "joy")
# Print top words for Anticipation and Joy
left_tokens %>%
  ___(anticipation, by = "word") %>%
  ___(word, sort = TRUE)
left_tokens %>%
  ___(joy, by = "word") %>%
  ___(word, sort = TRUE)

Code bewerken en uitvoeren

Introductie tot Natural Language Processing in R

SkillTag.level.intermediateSkillTag.label

4.8+

40 reviews

In hoofdstuk 4 behandelen we twee klassiekers binnen natural language processing: sentimentanalyse en word embeddings. Dit zijn twee analysetechnieken die onmisbaar zijn voor iedereen die de basis van tekstanalyse wil beheersen. Daarnaast maak je kort kennis met BERT, part-of-speech tagging en named entity recognition. In deze cursus kwamen bijna 15 verschillende analysetechnieken voorbij, dus hoofdstuk 4 sluit af met een overzicht van alle mooie technieken die je in deze cursus leert.

Exercise 1: Sentimentanalyse Exercise 2: tidytext-lexicons Exercise 3: Sentimentscores Exercise 4: Sentiment en emotie

Huidige oefening

Exercise 5: Woordembeddings Exercise 6: oefenen met h2o Exercise 7: word2vec Exercise 8: Aanvullende NLP-analyses Exercise 9: Methoden herzien #1 Exercise 10: Methoden herhalen #2 Exercise 11: Conclusie