IniziaInizia gratis

Comparison Cloud

In questo esercizio creerai una visualizzazione classica per capire la frequenza dei termini. In particolare, rivedrai i termini più frequenti nei documenti aggregati positivi e negativi. Ricorda la TermDocumentMatrix all_tdm che hai creato in precedenza. Invece di 1000 recensioni di affitti, la matrice contiene 2 documenti con tutte le recensioni separate in base al punteggio di polarity().

Di solito è più semplice convertire la TDM in una matrice. Da lì ti basta rinominare le colonne. Ricorda che la funzione colnames() si usa sul lato sinistro dell’operatore di assegnazione come mostrato sotto.

colnames(OBJECT) <- c("COLUMN_NAME1", "COLUMN_NAME2")

Una volta fatto, riordinerai la matrice per vedere le parole più positive e più negative. Dai un’occhiata a questi termini così potrai rispondere agli esercizi di conclusione!

Infine, visualizzerai i termini usando comparison.cloud().

Questo esercizio fa parte del corso

Sentiment Analysis in R

Visualizza il corso

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Matrix
___

# Column names
colnames(___) <- ___

# Top pos words
order_by_pos <- order(all_tdm_m[, ___], decreasing = ___)

# Review top 10 pos words
all_tdm_m[order_by_pos, ] %>% head(___)

# Top neg words
order_by_neg <- order(___, decreasing = ___)

# Review top 10 neg words
all_tdm_m[___, ] %>% ___
Modifica ed esegui il codice