Confronta Tidy Sentiment con Qdap Polarity

Qui scoprirai che metodi di sentiment diversi portano a risultati diversi. Spesso ti basterà che i risultati vadano nella stessa direzione, anche se i dettagli possono cambiare. Nell’ultimo esercizio hai creato tidy_reviews, un data frame di recensioni di affitti senza stopword. All’inizio del capitolo hai calcolato e tracciato la funzione polarity() di base di qdap. Questo ti ha mostrato che le recensioni tendono a essere positive.

Ora eseguiamo un’analisi simile con l’approccio di tidytext! Ricorda da un capitolo precedente che eseguirai un inner_join() seguito da count() e poi da un pivot_wider().

Infine, creerai una nuova colonna usando mutate() passando positive - negative.

Questo esercizio fa parte del corso

Sentiment Analysis in R

Visualizza il corso

Istruzioni dell'esercizio

Usando la funzione get_sentiments() con "bing" otterrai il lessico di soggettività bing. Chiama il lessico bing.
Dato che hai già scritto questo codice nel Capitolo 2, inserisci semplicemente l’oggetto del lessico, bing, il nome della nuova colonna (polarity) e il suo calcolo all’interno di mutate().
Infine, richiama summary() sul nuovo oggetto pos_neg. Anche se i valori sono diversi, osservando la media, la maggior parte delle recensioni degli affitti risulta ugualmente positiva rispetto all’uso di polarity()? Noti una sorta di "inflazione dei voti"?

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Get the correct lexicon
bing <- ___

# Calculate polarity for each review
pos_neg <- tidy_reviews %>% 
  inner_join(___) %>%
  count(sentiment) %>%
  pivot_wider(names_from = sentiment, values_from = n, values_fill = 0) %>% 
  mutate(___ = ___ - ___)

# Check outcome
___

Modifica ed esegui il codice