IniziaInizia gratis

Esamina velocemente la polarità di base

Quando inizi un progetto di sentiment analysis, a volte una rapida polarity() ti aiuta a fissare le aspettative o a capire meglio il problema. In questo esercizio (per risparmiare tempo), applicherai polarity() a una parte del vettore comments, mentre l’oggetto di polarità più grande viene caricato in background.

Usando un grafico di densità kernel dovresti notare che le recensioni non sono centrate su 0. Spesso ci sono due cause per questa “inflazione del voto” del sentiment. Primo, le norme sociali possono portare i rispondenti a essere gentili invece che neutrali. Questo, ovviamente, dipende dal canale. Canali particolarmente pungenti come e-sport o post sui social possono inclinare al negativo portando a una “deflazione”. Questi canali hanno aspettative diverse. Una seconda possibile ragione potrebbe essere il “sentiment basato sulle feature”. In alcune recensioni l’autore può scrivere: “il letto era comodo e bello, ma la cucina era sporca e disgustosa”. Il sentiment di questo tipo di recensione comprende più caratteristiche contemporaneamente e quindi può far risultare una media distorta.

In un esercizio successivo correggerai questa “inflazione del voto”, ma qui esplora le recensioni senza alcuna modifica.

Questo esercizio fa parte del corso

Sentiment Analysis in R

Visualizza il corso

Istruzioni dell'esercizio

  • Crea practice_pol usando polarity() sulle prime sei recensioni come in bos_reviews$comments[1:6].
  • Esamina l’oggetto di polarità restituito richiamando practice_pol.
  • Esegui summary() su practice_pol$all$polarity: accederai alla polarità complessiva di tutti e 6 i commenti.
  • Abbiamo anche caricato un oggetto di polarità più grande per tutti i 1000 commenti. Questo nuovo oggetto si chiama bos_pol. Ora applica summary() all’elemento corretto della lista che restituisce tutti i punteggi di polarity di bos_pol.
  • Il codice di esempio ha un barplot e un grafico di densità kernel quasi pronti da stampare. Devi inserire il data frame che rappresenta tutti i punteggi. Suggerimento: nel passaggio precedente, polarity rappresenta una colonna di questo data frame.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Practice apply polarity to first 6 reviews
practice_pol <- ___

# Review the object
___

# Check out the practice polarity
___

# Summary for all reviews
___

# Plot Boston polarity all element
ggplot(___, aes(x = polarity, y = ..density..)) + 
  geom_histogram(binwidth = 0.25, fill = "#bada55", colour = "grey60") +
  geom_density(size = 0.75) +
  theme_gdocs() 
Modifica ed esegui il codice