IniziaInizia gratis

Modello LDA

È il momento di costruire il modello LDA. Usando dictionary e corpus, sei pronto a scoprire quali topic sono presenti nelle email di Enron. Con una veloce stampa delle parole assegnate ai topic puoi fare una prima esplorazione e vedere se emergono argomenti evidenti. Tieni presente che il topic model è pesante da calcolare, quindi l’esecuzione richiederà un po’ di tempo. Proviamoci!

Questo esercizio fa parte del corso

Rilevamento delle frodi in Python

Visualizza il corso

Istruzioni dell'esercizio

  • Crea il modello LDA dai modelli di gensim, inserendo corpus e dictionary.
  • Salva i 5 topic eseguendo print sui topic nei risultati del modello e seleziona le prime 5 parole.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Define the LDA model
ldamodel = gensim.models.____.____(____, num_topics=5, id2word=____, passes=5)

# Save the topics and top 5 words
topics = ____.____(num_words=____)

# Print the results
for topic in topics:
    print(topic)
Modifica ed esegui il codice