IniziaInizia gratis

Rivedere i risultati LDA

Hai sviluppato un topic model, napoleon_model, con 5 argomenti per le frasi del libro Animal Farm che fanno riferimento al protagonista Napoleon. Hai chiesto a 5 autori locali di rivedere le parole e le frasi principali per ciascun argomento e ti hanno fornito dei temi per ogni argomento.

Per finalizzare i risultati, prepara alcune statistiche riassuntive sugli argomenti. Presenterai questi valori riassuntivi insieme ai temi al tuo capo per la revisione.

Questo esercizio fa parte del corso

Introduzione all'Elaborazione del Linguaggio Naturale in R

Visualizza il corso

Istruzioni dell'esercizio

  • Estrai la matrice gamma dal topic model, napoleon_model.
  • Usa le funzioni di dplyr per creare una tibble con l’argomento principale di ciascuna frase chiamata grouped_gammas.
  • Usa grouped_gammas per contare quante frasi sono più simili a ciascun argomento.
  • Usa grouped_gammas e calcola il valore medio di gamma per ciascun argomento.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Extract the gamma matrix 
gamma_values <- tidy(___, matrix = ___)
# Create grouped gamma tibble
grouped_gammas <- gamma_values %>%
  ___(document) %>%
  ___(desc(gamma)) %>%
  ___(1) %>%
  ___(topic)
# Count (tally) by topic
grouped_gammas %>% 
  ___(topic, sort=TRUE)
# Average topic weight for top topic for each sentence
grouped_gammas %>% 
  ___(avg=mean(gamma)) %>%
  ___(desc(avg))
Modifica ed esegui il codice