Polarità su testo reale
Finora hai imparato gli elementi di base per valutare l’intento positivo o negativo in un testo. Ricorda i seguenti punti per sentirti sicuro dei tuoi risultati.
- Il subjectivity lexicon è un elenco predefinito di parole associate a emozioni o sentimenti positivi/negativi.
- Non devi elencare ogni parola in un subjectivity lexicon perché la legge di Zipf descrive l’espressione umana.
Un modo rapido per iniziare è usare la funzione polarity(), che include un subjectivity lexicon integrato.
La funzione scansiona il testo per identificare le parole presenti nel lessico. Quindi crea un cluster attorno a una parola di soggettività identificata. All’interno del cluster i valence shifters regolano il punteggio. I valence shifters sono parole che amplificano o negano l’intento emotivo della parola di soggettività. Per esempio, "well known" è positivo mentre "not well known" è negativo. Qui "not" è un termine di negazione e inverte l’intento emotivo di "well known". Al contrario, "very well known" usa un amplificatore che aumenta l’intento positivo.
La funzione polarity() calcola poi un punteggio usando i termini di soggettività, i valence shifters e il numero totale di parole nel brano. Questo esercizio mostra un semplice calcolo di polarità. Nel prossimo video guardiamo sotto il cofano di polarity() per maggiori dettagli.
Questo esercizio fa parte del corso
Sentiment Analysis in R
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Example statement
positive <- "DataCamp courses are good for learning"
# Calculate polarity of statement
(pos_score <-___(___))