Polarità tidy con Bing: esempio semplice
Ora che hai capito le basi di un inner join, applichiamole al lessico "Bing". Ricorda che la funzione inner_join() proviene da dplyr e che l'oggetto del lessico si ottiene usando get_sentiments() di tidytext.
Il lessico Bing etichetta le parole come positive o negative. I prossimi tre esercizi ti permetteranno di interagire con questo specifico lessico. Per usare get_sentiments() passa una stringa come "afinn", "bing", "nrc" o "loughran" per scaricare il lessico desiderato.
Workflow dell'inner join:
- Ottieni il lessico corretto usando
get_sentiments(). - Passa il lessico e i dati di testo in formato tidy a
inner_join(). - Perché
inner_join()funzioni deve esserci un nome di colonna condiviso. Se non ci sono nomi di colonna in comune, dichiarali con un parametro aggiuntivo,byuguale accon i nomi delle colonne come sotto.
object <- x %>%
inner_join(y, by = c("column_from_x" = "column_from_y"))
- Esegui un po' di aggregazione e analisi sull'intersezione delle tabelle.
Questo esercizio fa parte del corso
Sentiment Analysis in R
Istruzioni dell'esercizio
Abbiamo caricato ag_txt con le prime 100 righe di Agamennone e ag_tidy, la sua versione tidy.
- Per confronto, usa
polarity()suag_txt. - Ottieni il lessico
"bing"passando quella stringa aget_sentiments(). - Esegui un
inner_join()traag_tidyebing.- Le colonne delle parole si chiamano
"term"inag_tidye"word"nel lessico, quindi dichiara l'argomentoby. - Chiama il nuovo oggetto
ag_bing_words.
- Le colonne delle parole si chiamano
- Stampa
ag_bing_wordse osserva alcune delle parole presenti nel risultato. - Passa
ag_bing_wordsacount()disentimentusando l'operatore pipe %>%. Confronta il punteggio dipolarity()con il rapporto tra conteggi di sentiment.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Qdap polarity
___
# Get Bing lexicon
bing <- get_sentiments("___")
# Join text to lexicon
ag_bing_words <- ___(___, ___, by = c("___" = "___"))
# Examine
ag_bing_words
# Get counts by sentiment
ag_bing_words %>%
___(___)