Esercizio su LDA
Ti interessano i temi ricorrenti legati al personaggio Napoleon nel tuo nuovo libro preferito, Animal Farm. Napoleon è un maiale che convince i suoi compagni a rovesciare i loro leader umani. Alla fine diventa anche il nuovo leader di Animal Farm.
Hai estratto tutte le frasi che menzionano il nome di Napoleon, pig_sentences, e hai creato la versione tokenizzata di queste frasi rimuovendo le stop word e applicando lo stemming, pig_tokens. Esegui LDA su queste frasi e osserva le parole principali associate ad alcuni dei topic.
Questo esercizio fa parte del corso
Introduzione all'Elaborazione del Linguaggio Naturale in R
Istruzioni dell'esercizio
- Esegui LDA su
pig_matrixidentificando 10 topic. Imposta un seed casuale a1111per la riproducibilità. - Estrai la matrice beta dai risultati.
- Filtra la matrice beta al solo topic 2 e ordina i valori in ordine decrescente di beta.
- Filtra la matrice beta al solo topic 3 e ordina i valori in ordine decrescente di beta.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
library(topicmodels)
# Perform Topic Modeling
sentence_lda <-
___(___, k = ___, method = 'Gibbs', control = list(seed = ___))
# Extract the beta matrix
sentence_betas <- ___(sentence_lda, matrix = "___")
# Topic #2
sentence_betas %>%
___(topic == ___) %>%
arrange(-___)
# Topic #3
sentence_betas %>%
___(topic == ___) %>%
arrange(-___)