Confronta Tidy Sentiment con Qdap Polarity
Qui scoprirai che metodi di sentiment diversi portano a risultati diversi. Spesso ti basterà che i risultati vadano nella stessa direzione, anche se i dettagli possono cambiare. Nell’ultimo esercizio hai creato tidy_reviews, un data frame di recensioni di affitti senza stopword. All’inizio del capitolo hai calcolato e tracciato la funzione polarity() di base di qdap. Questo ti ha mostrato che le recensioni tendono a essere positive.
Ora eseguiamo un’analisi simile con l’approccio di tidytext! Ricorda da un capitolo precedente che eseguirai un inner_join() seguito da count() e poi da un pivot_wider().
Infine, creerai una nuova colonna usando mutate() passando positive - negative.
Questo esercizio fa parte del corso
Sentiment Analysis in R
Istruzioni dell'esercizio
- Usando la funzione
get_sentiments()con "bing" otterrai il lessico di soggettività bing. Chiama il lessicobing. - Dato che hai già scritto questo codice nel Capitolo 2, inserisci semplicemente l’oggetto del lessico,
bing, il nome della nuova colonna (polarity) e il suo calcolo all’interno dimutate(). - Infine, richiama
summary()sul nuovo oggettopos_neg. Anche se i valori sono diversi, osservando la media, la maggior parte delle recensioni degli affitti risulta ugualmente positiva rispetto all’uso dipolarity()? Noti una sorta di "inflazione dei voti"?
esercizio interattivo pratico
Prova questo esercizio completando questo codice di esempio.
# Get the correct lexicon
bing <- ___
# Calculate polarity for each review
pos_neg <- tidy_reviews %>%
inner_join(___) %>%
count(sentiment) %>%
pivot_wider(names_from = sentiment, values_from = n, values_fill = 0) %>%
mutate(___ = ___ - ___)
# Check outcome
___