Rivedere i risultati LDA
Hai sviluppato un topic model, napoleon_model, con 5 argomenti per le frasi del libro Animal Farm che fanno riferimento al protagonista Napoleon. Hai chiesto a 5 autori locali di rivedere le parole e le frasi principali per ciascun argomento e ti hanno fornito dei temi per ogni argomento.
Per finalizzare i risultati, prepara alcune statistiche riassuntive sugli argomenti. Presenterai questi valori riassuntivi insieme ai temi al tuo capo per la revisione.
Questo esercizio fa parte del corso
Introduzione all'Elaborazione del Linguaggio Naturale in R
Istruzioni dell'esercizio
- Estrai la matrice gamma dal topic model,
napoleon_model. - Usa le funzioni di
dplyrper creare una tibble con l’argomento principale di ciascuna frase chiamatagrouped_gammas. - Usa
grouped_gammasper contare quante frasi sono più simili a ciascun argomento. - Usa
grouped_gammase calcola il valore medio di gamma per ciascun argomento.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Extract the gamma matrix
gamma_values <- tidy(___, matrix = ___)
# Create grouped gamma tibble
grouped_gammas <- gamma_values %>%
___(document) %>%
___(desc(gamma)) %>%
___(1) %>%
___(topic)
# Count (tally) by topic
grouped_gammas %>%
___(topic, sort=TRUE)
# Average topic weight for top topic for each sentence
grouped_gammas %>%
___(avg=mean(gamma)) %>%
___(desc(avg))