Confronta Tidy Sentiment con Qdap Polarity
Qui scoprirai che metodi di sentiment diversi portano a risultati diversi. Spesso ti basterà che i risultati vadano nella stessa direzione, anche se i dettagli possono cambiare. Nell’ultimo esercizio hai creato tidy_reviews, un data frame di recensioni di affitti senza stopword. All’inizio del capitolo hai calcolato e tracciato la funzione polarity() di base di qdap. Questo ti ha mostrato che le recensioni tendono a essere positive.
Ora eseguiamo un’analisi simile con l’approccio di tidytext! Ricorda da un capitolo precedente che eseguirai un inner_join() seguito da count() e poi da un pivot_wider().
Infine, creerai una nuova colonna usando mutate() passando positive - negative.
Questo esercizio fa parte del corso
Sentiment Analysis in R
Istruzioni dell'esercizio
- Usando la funzione
get_sentiments()con "bing" otterrai il lessico di soggettività bing. Chiama il lessicobing. - Dato che hai già scritto questo codice nel Capitolo 2, inserisci semplicemente l’oggetto del lessico,
bing, il nome della nuova colonna (polarity) e il suo calcolo all’interno dimutate(). - Infine, richiama
summary()sul nuovo oggettopos_neg. Anche se i valori sono diversi, osservando la media, la maggior parte delle recensioni degli affitti risulta ugualmente positiva rispetto all’uso dipolarity()? Noti una sorta di "inflazione dei voti"?
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Get the correct lexicon
bing <- ___
# Calculate polarity for each review
pos_neg <- tidy_reviews %>%
inner_join(___) %>%
count(sentiment) %>%
pivot_wider(names_from = sentiment, values_from = n, values_fill = 0) %>%
mutate(___ = ___ - ___)
# Check outcome
___