Esamina velocemente la polarità di base
Quando inizi un progetto di sentiment analysis, a volte una rapida polarity() ti aiuta a fissare le aspettative o a capire meglio il problema. In questo esercizio (per risparmiare tempo), applicherai polarity() a una parte del vettore comments, mentre l’oggetto di polarità più grande viene caricato in background.
Usando un grafico di densità kernel dovresti notare che le recensioni non sono centrate su 0. Spesso ci sono due cause per questa “inflazione del voto” del sentiment. Primo, le norme sociali possono portare i rispondenti a essere gentili invece che neutrali. Questo, ovviamente, dipende dal canale. Canali particolarmente pungenti come e-sport o post sui social possono inclinare al negativo portando a una “deflazione”. Questi canali hanno aspettative diverse. Una seconda possibile ragione potrebbe essere il “sentiment basato sulle feature”. In alcune recensioni l’autore può scrivere: “il letto era comodo e bello, ma la cucina era sporca e disgustosa”. Il sentiment di questo tipo di recensione comprende più caratteristiche contemporaneamente e quindi può far risultare una media distorta.
In un esercizio successivo correggerai questa “inflazione del voto”, ma qui esplora le recensioni senza alcuna modifica.
Questo esercizio fa parte del corso
Sentiment Analysis in R
Istruzioni dell'esercizio
- Crea
practice_polusandopolarity()sulle prime sei recensioni come inbos_reviews$comments[1:6]. - Esamina l’oggetto di polarità restituito richiamando
practice_pol. - Esegui
summary()supractice_pol$all$polarity: accederai alla polarità complessiva di tutti e 6 i commenti. - Abbiamo anche caricato un oggetto di polarità più grande per tutti i 1000 commenti. Questo nuovo oggetto si chiama
bos_pol. Ora applicasummary()all’elemento corretto della lista che restituisce tutti i punteggi di polarity dibos_pol. - Il codice di esempio ha un barplot e un grafico di densità kernel quasi pronti da stampare. Devi inserire il data frame che rappresenta tutti i punteggi. Suggerimento: nel passaggio precedente,
polarityrappresenta una colonna di questo data frame.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Practice apply polarity to first 6 reviews
practice_pol <- ___
# Review the object
___
# Check out the practice polarity
___
# Summary for all reviews
___
# Plot Boston polarity all element
ggplot(___, aes(x = polarity, y = ..density..)) +
geom_histogram(binwidth = 0.25, fill = "#bada55", colour = "grey60") +
geom_density(size = 0.75) +
theme_gdocs()