Polarità tidy con Bing: conta e fai il pivot della balena bianca
In questo esercizio applicherai un altro inner_join() usando il lessico "bing".
Poi manipolerai i risultati sia con count() di dplyr sia con pivot_wider() di tidyr per esplorare il testo.
La funzione pivot_wider() distribuisce i dati su più colonne. In questo caso, il sentiment e i corrispondenti valori n rappresentano la frequenza dei termini positivi o negativi per ogni riga. Usare pivot_wider() modifica i dati in modo che ogni riga abbia ora valori positivi e negativi, anche se pari a 0.
Questo esercizio fa parte del corso
Sentiment Analysis in R
Istruzioni dell'esercizio
In questo esercizio, la tua sessione R ha m_dick_tidy, che contiene il libro Moby Dick, e bing, che contiene il lessico simile all'esercizio precedente.
- Esegui un
inner_join()tram_dick_tidyebing.- Come prima, unisci la colonna
"term"dim_dick_tidycon la colonna"word"del lessico. - Chiama il nuovo oggetto
moby_lex_words.
- Come prima, unisci la colonna
- Crea una colonna
index, uguale aas.numeric()applicata adocument. Questo avviene all'interno dimutate()nel tidyverse. - Crea
moby_countinoltrandomoby_lex_wordsacount(), passandosentiment, index. - Genera
moby_widefacendo la pipe dimoby_countapivot_wider()dovenames_fromè la colonnasentiment,values_fromè la colonnane i valori vengono riempiti convalues_fill = 0. arrangeè la pipe successiva usata per ordinare le righe in base ai valori diindex
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Inner join
moby_lex_words <- inner_join(___, ___, by = c("___" = "___"))
moby_lex_words <- moby_lex_words %>%
# Set index to numeric document
mutate(___ = as.numeric(___))
moby_count <- moby_lex_words %>%
# Count by sentiment, index
___(___, ___)
# Examine the counts
moby_count
moby_wide <- moby_count %>%
# Pivot the sentiments
pivot_wider(names_from = ___, values_from = ___, values_fill = ___) %>%
arrange(index)
# Review the pivoted data
moby_wide