Modello LDA

È il momento di costruire il modello LDA. Usando dictionary e corpus, sei pronto a scoprire quali topic sono presenti nelle email di Enron. Con una veloce stampa delle parole assegnate ai topic puoi fare una prima esplorazione e vedere se emergono argomenti evidenti. Tieni presente che il topic model è pesante da calcolare, quindi l’esecuzione richiederà un po’ di tempo. Proviamoci!

Questo esercizio fa parte del corso

Rilevamento delle frodi in Python

Visualizza corso

Istruzioni dell'esercizio

Crea il modello LDA dai modelli di gensim, inserendo corpus e dictionary.
Salva i 5 topic eseguendo print sui topic nei risultati del modello e seleziona le prime 5 parole.

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

# Define the LDA model
ldamodel = gensim.models.____.____(____, num_topics=5, id2word=____, passes=5)

# Save the topics and top 5 words
topics = ____.____(num_words=____)

# Print the results
for topic in topics:
    print(topic)

Modifica ed esegui il codice