IniziaInizia gratis

Valutare l'impegno dell'autore

Spesso gli autori usano più parole quando sono più appassionati. Per esempio, un passeggero arrabbiato con una compagnia aerea lascerà una recensione più lunga quanto peggiore è (percepito) il servizio. Al contrario, un passeggero meno coinvolto potrebbe non sentirsi motivato a spendere molto tempo per scrivere una recensione. Le recensioni molto lunghe possono gonfiare il sentiment complessivo, perché con l'aumentare della lunghezza contengono inevitabilmente più linguaggio positivo o negativo. Questo esercizio di coding ti aiuta a esaminare impegno e sentiment.

In questo esercizio visualizzerai la relazione tra impegno e sentiment. Ricorda che il tuo tibble di recensioni dell'alloggio contiene un id e che ogni riga rappresenta una parola. Di conseguenza, un semplice count() dell'id catturerà il numero di parole usate in ciascuna recensione. Poi unirai questo riepilogo ai dati positivi e negativi. Infine creerai uno scatter plot che visualizza la lunghezza della recensione dell'autore e la sua relazione con la polarità.

Questo esercizio fa parte del corso

Sentiment Analysis in R

Visualizza il corso

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Review tidy_reviews and pos_neg
tidy_reviews
pos_neg

pos_neg_pol <- tidy_reviews %>% 
  # Effort is measured as count by id
  ___(___) %>% 
  # Inner join to pos_neg
  ___(___) %>% 
  # Add polarity status
  ___(pol = ___(___, "___", "___"))

# Examine results
pos_neg_pol
Modifica ed esegui il codice