IniziaInizia gratis

Polarità tidy con Bing: esempio semplice

Ora che hai capito le basi di un inner join, applichiamole al lessico "Bing". Ricorda che la funzione inner_join() proviene da dplyr e che l'oggetto del lessico si ottiene usando get_sentiments() di tidytext.

Il lessico Bing etichetta le parole come positive o negative. I prossimi tre esercizi ti permetteranno di interagire con questo specifico lessico. Per usare get_sentiments() passa una stringa come "afinn", "bing", "nrc" o "loughran" per scaricare il lessico desiderato.

Workflow dell'inner join:

  • Ottieni il lessico corretto usando get_sentiments().
  • Passa il lessico e i dati di testo in formato tidy a inner_join().
  • Perché inner_join() funzioni deve esserci un nome di colonna condiviso. Se non ci sono nomi di colonna in comune, dichiarali con un parametro aggiuntivo, by uguale a c con i nomi delle colonne come sotto.
object <- x %>% 
    inner_join(y, by = c("column_from_x" = "column_from_y"))
  • Esegui un po' di aggregazione e analisi sull'intersezione delle tabelle.

Questo esercizio fa parte del corso

Sentiment Analysis in R

Visualizza il corso

Istruzioni dell'esercizio

Abbiamo caricato ag_txt con le prime 100 righe di Agamennone e ag_tidy, la sua versione tidy.

  • Per confronto, usa polarity() su ag_txt.
  • Ottieni il lessico "bing" passando quella stringa a get_sentiments().
  • Esegui un inner_join() tra ag_tidy e bing.
    • Le colonne delle parole si chiamano "term" in ag_tidy e "word" nel lessico, quindi dichiara l'argomento by.
    • Chiama il nuovo oggetto ag_bing_words.
  • Stampa ag_bing_words e osserva alcune delle parole presenti nel risultato.
  • Passa ag_bing_words a count() di sentiment usando l'operatore pipe %>%. Confronta il punteggio di polarity() con il rapporto tra conteggi di sentiment.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Qdap polarity
___

# Get Bing lexicon
bing <- get_sentiments("___")

# Join text to lexicon
ag_bing_words <- ___(___, ___, by = c("___" = "___"))

# Examine
ag_bing_words

# Get counts by sentiment
ag_bing_words %>%
  ___(___)
Modifica ed esegui il codice