IniziaInizia gratis

Polarità tidy con Bing: conta e fai il pivot della balena bianca

In questo esercizio applicherai un altro inner_join() usando il lessico "bing".

Poi manipolerai i risultati sia con count() di dplyr sia con pivot_wider() di tidyr per esplorare il testo.

La funzione pivot_wider() distribuisce i dati su più colonne. In questo caso, il sentiment e i corrispondenti valori n rappresentano la frequenza dei termini positivi o negativi per ogni riga. Usare pivot_wider() modifica i dati in modo che ogni riga abbia ora valori positivi e negativi, anche se pari a 0.

Questo esercizio fa parte del corso

Sentiment Analysis in R

Visualizza il corso

Istruzioni dell'esercizio

In questo esercizio, la tua sessione R ha m_dick_tidy, che contiene il libro Moby Dick, e bing, che contiene il lessico simile all'esercizio precedente.

  • Esegui un inner_join() tra m_dick_tidy e bing.
    • Come prima, unisci la colonna "term" di m_dick_tidy con la colonna "word" del lessico.
    • Chiama il nuovo oggetto moby_lex_words.
  • Crea una colonna index, uguale a as.numeric() applicata a document. Questo avviene all'interno di mutate() nel tidyverse.
  • Crea moby_count inoltrando moby_lex_words a count(), passando sentiment, index.
  • Genera moby_wide facendo la pipe di moby_count a pivot_wider() dove names_from è la colonna sentiment, values_from è la colonna n e i valori vengono riempiti con values_fill = 0.
  • arrange è la pipe successiva usata per ordinare le righe in base ai valori di index

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Inner join
moby_lex_words <- inner_join(___, ___, by = c("___" = "___"))

moby_lex_words <- moby_lex_words %>%
  # Set index to numeric document
  mutate(___ = as.numeric(___))

moby_count <- moby_lex_words %>%
  # Count by sentiment, index
  ___(___, ___)

# Examine the counts
moby_count

moby_wide <- moby_count %>%
  # Pivot the sentiments
  pivot_wider(names_from = ___, values_from = ___, values_fill = ___) %>% 
  arrange(index)

# Review the pivoted data
moby_wide
Modifica ed esegui il codice