IniziaInizia gratis

Esercizio su LDA

Ti interessano i temi ricorrenti legati al personaggio Napoleon nel tuo nuovo libro preferito, Animal Farm. Napoleon è un maiale che convince i suoi compagni a rovesciare i loro leader umani. Alla fine diventa anche il nuovo leader di Animal Farm.

Hai estratto tutte le frasi che menzionano il nome di Napoleon, pig_sentences, e hai creato la versione tokenizzata di queste frasi rimuovendo le stop word e applicando lo stemming, pig_tokens. Esegui LDA su queste frasi e osserva le parole principali associate ad alcuni dei topic.

Questo esercizio fa parte del corso

Introduzione all'Elaborazione del Linguaggio Naturale in R

Visualizza il corso

Istruzioni dell'esercizio

  • Esegui LDA su pig_matrix identificando 10 topic. Imposta un seed casuale a 1111 per la riproducibilità.
  • Estrai la matrice beta dai risultati.
  • Filtra la matrice beta al solo topic 2 e ordina i valori in ordine decrescente di beta.
  • Filtra la matrice beta al solo topic 3 e ordina i valori in ordine decrescente di beta.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

library(topicmodels)
# Perform Topic Modeling
sentence_lda <-
  ___(___, k = ___, method = 'Gibbs', control = list(seed = ___))
# Extract the beta matrix 
sentence_betas <- ___(sentence_lda, matrix = "___")

# Topic #2
sentence_betas %>%
  ___(topic == ___) %>%
  arrange(-___)
# Topic #3
sentence_betas %>%
  ___(topic == ___) %>%
  arrange(-___)
Modifica ed esegui il codice