Assegnare argomenti ai documenti
Creare modelli LDA serve a poco se non riesci a interpretarne e usarne i risultati. Ti sono stati forniti i risultati dell’esecuzione di un modello LDA, sentence_lda, su un insieme di frasi, pig_sentences. Devi esplorare entrambe le matrici beta, parole principali per argomento, e gamma, argomenti principali per documento, per comprendere a fondo i risultati di qualsiasi analisi LDA.
In base a ciò che sai su queste due matrici, estrai i risultati per un argomento specifico e verifica se l’output corrisponde alle aspettative.
Questo esercizio fa parte del corso
Introduzione all'Elaborazione del Linguaggio Naturale in R
Istruzioni dell'esercizio
- Crea una tibble per entrambe le matrici
betaegamma. - Esplora l’argomento 5 osservando le parole principali per l’argomento 5 e ordina i risultati in base ai valori di
betadecrescenti. - Esplora l’argomento 5 verificando quali frasi si allineano maggiormente con l’argomento 5 e ordina i risultati in base ai valori di
gammadecrescenti.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Extract the beta and gamma matrices
sentence_betas <- tidy(sentence_lda, ___ = "___")
sentence_gammas <- tidy(sentence_lda, ___ = "___")
# Explore Topic 5 Betas
___ %>%
___(topic == ___) %>%
arrange(-___)
# Explore Topic 5 Gammas
___ %>%
___(topic == ___) %>%
arrange(-___)