Valutare l'impegno dell'autore
Spesso gli autori usano più parole quando sono più appassionati. Per esempio, un passeggero arrabbiato con una compagnia aerea lascerà una recensione più lunga quanto peggiore è (percepito) il servizio. Al contrario, un passeggero meno coinvolto potrebbe non sentirsi motivato a spendere molto tempo per scrivere una recensione. Le recensioni molto lunghe possono gonfiare il sentiment complessivo, perché con l'aumentare della lunghezza contengono inevitabilmente più linguaggio positivo o negativo. Questo esercizio di coding ti aiuta a esaminare impegno e sentiment.
In questo esercizio visualizzerai la relazione tra impegno e sentiment. Ricorda che il tuo tibble di recensioni dell'alloggio contiene un id e che ogni riga rappresenta una parola. Di conseguenza, un semplice count() dell'id catturerà il numero di parole usate in ciascuna recensione. Poi unirai questo riepilogo ai dati positivi e negativi. Infine creerai uno scatter plot che visualizza la lunghezza della recensione dell'autore e la sua relazione con la polarità.
Questo esercizio fa parte del corso
Sentiment Analysis in R
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Review tidy_reviews and pos_neg
tidy_reviews
pos_neg
pos_neg_pol <- tidy_reviews %>%
# Effort is measured as count by id
___(___) %>%
# Inner join to pos_neg
___(___) %>%
# Add polarity status
___(pol = ___(___, "___", "___"))
# Examine results
pos_neg_pol