Lo straordinario mago di NRC
Ultimo ma non meno importante, lavorerai con il lessico NRC, che etichetta le parole in base a più stati emotivi. Ti ricordi la ruota delle emozioni di Plutchik? Il lessico NRC assegna tag alle parole secondo le 8 emozioni di Plutchik più positivo/negativo.
In questo esercizio c’è un nuovo operatore, %in%, che verifica se gli elementi di un vettore compaiono in un altro. Nel codice qui sotto, %in% restituirà FALSE, FALSE, TRUE. Questo perché in some_vec, 1 e 2 non si trovano in some_other_vector, mentre 3 sì e quindi restituisce TRUE. %in% è utile per trovare corrispondenze.
some_vec <- c(1, 2, 3)
some_other_vector <- c(3, "a", "b")
some_vec %in% some_other_vector
Un altro nuovo operatore è !. Per condizioni logiche, anteporre ! inverte il risultato. Nell’esempio sopra, i valori FALSE, FALSE, TRUE diventano TRUE, TRUE, FALSE. Usarlo insieme a %in% inverte la risposta ed è utile per rimuovere gli elementi che trovano una corrispondenza.
!some_vec %in% some_other_vector
Abbiamo creato oz, la versione tidy di The Wizard of Oz, insieme a nrc che contiene il lessico "NRC" con colonne rinominate.
Questo esercizio fa parte del corso
Sentiment Analysis in R
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
oz_plutchik <- oz %>%
# Join to nrc lexicon by term = word
inner_join(___, by = ___("___" = "___")) %>%
# Only consider Plutchik sentiments
___(!___ %in% c("___", "___")) %>%
# Group by sentiment
___(___) %>%
# Get total count by sentiment
___(total_count = ___(___))